AI エンジン - 2022.1 日本語

Versal ACAP デザイン ガイド (UG1273)

Document ID
UG1273
Release Date
2022-04-27
Version
2022.1 日本語

Versal AI コア シリーズは、現在のサーバークラス CPU の 100 倍以上の演算性能を達成する AI エンジンを備え、AI 推論を飛躍的に高速化します。このシリーズは、動的ワークロード対応のクラウドや超広帯域幅ネットワークなどの幅広いアプリケーションをサポートすると同時に、最先端の安全性およびセキュリティ機能も提供します。ソフトウェアおよびハードウェア開発者だけでなく、AI およびデータ サイエンティストも、高い演算密度を活用してあらゆるアプリケーションのパフォーマンスを高速化できます。AI エンジンは高度な信号処理演算機能を備えており、無線、5G、バックホール、高パフォーマンス DSP アプリケーションなどの高度に最適化されたワイヤレス アプリケーションに最適です。

AI エンジンは、単一命令複数データ (SIMD) ベクター ユニットを備えた超長命令語 (VLIW) プロセッサのアレイで構成されており、特にデジタル信号処理 (DSP)、5G ワイヤレス アプリケーション、機械学習 (ML) をはじめとする人工知能 (AI) テクノロジなど、演算負荷の高いアプリケーション用に最適化されています。

AI エンジンは、命令レベルやデータ レベルの並列処理性など、複数のレベルの並列実行をサポートするハード ブロックです。命令レベルの並列実行では、1 つのスカラー演算、最大 2 つの移動、2 つのベクター読み出し (ロード)、1 つのベクター書き込み (ストア)、および 1 つのベクター命令を 1 クロック サイクルで実行できます (7 ウェイ VLIW 命令)。データ レベルの並列実行は、1 クロック サイクルで複数のデータ セットを処理できるベクター レベルの演算により実現されます。各 AI エンジンはベクターおよびスカラー プロセッサ、専用プログラム メモリ、ローカル 32KB データ メモリを内蔵し、隣接する 3 方向のローカル メモリにアクセスできます。また、DMA エンジンおよび AXI4 インターコネクト スイッチにアクセスして、ほかの AI エンジン、プログラマブル ロジック (PL)、または DMA とストリームを介して通信することも可能です。AI エンジン アレイおよびインターフェイスの詳細は、 『Versal ACAP AI エンジン アーキテクチャ マニュアル』 (AM009) を参照してください。