AIE-ML プロセッサ

Versal アダプティブ SoC AIE-ML アーキテクチャ マニュアル (AM020)

Document ID
AM020
Release Date
2023-11-10
Revision
1.2 日本語

AIE と同様、AIE-ML の AI エンジン プロセッサもスカラー 32 ビット データパス、SIMD ベクトル データパス、2 つのロード ユニット、1 つのストア ユニットで構成され、ML アプリケーションに最適化されています。

次に、AIE-ML プロセッサの機能を示します。

  • 命令ベースの VLIW SIMD プロセッサに新しい命令を追加
  • AIE と同じ 16 KB プログラム メモリ
  • ベクトル ユニットは 256 (8b x 8b) および 512 (4b x 8b) MAC 演算をサポート
  • ベクトル ユニットは FP32 累算を使用した 128 の bloat16 MAC 演算をサポート
  • ベクトル ユニットは cint32 x cint16 乗算 (cint32 のデータと cint16 の回転因子)、複素数と共役の制御サポート、新しい並べ替えモード、およびシャッフル モードなど、ML 推論用にスパース構造および FFT 処理をサポート。詳細は、スパース性 を参照してください。
  • 新しいプロセッサ バスにより、プロセッサからローカル AIE-ML タイル内のメモリ マップド レジスタへのアクセスが可能
  • 複雑な循環アドレス指定モードの代わりに 3D アドレス指定モードを導入
  • スパース型の重みのロード時にオンザフライで圧縮を伸張。詳細は、スパース性 を参照してください。

AIE-ML プロセッサでは、AIE プロセッサで使用されていた高度な DSP 機能がいくつか削除されています。これには次のものが含まれます。

  • 32 ビット浮動小数点ベクトル データパスは直接サポートされず、複数の 16 x 16 ビット乗算に分解することでエミュレーションによりサポート
  • sin/cos、sqrt、inverse sqrt および inverse などのスカラー非線形関数
  • スカラー浮動小数点/整数変換
  • 複雑な環状アドレス指定および FFT アドレス指定モード。ただし、FFT と複素数はある程度までサポートされます。詳細は、AIE-ML プロセッサの機能を参照してください。
  • 128 ビット ロード/ストアを制限付きでサポート
  • アライメントなしのメモリ アクセス
  • いくつかの複素数データ型をサポート。複素数はある程度までサポートされます。詳細は、AIE-ML プロセッサの機能を参照してください。
  • 32 × 32 乗算のネイティブ サポート。ただし 16 ビット整数オペランドを使用してエミュレーション可能
  • ノンブロッキング 128 ビット ストリーム インターフェイスおよびストリーム FIFO を廃止
  • 制御ストリームおよびパケット ヘッダー生成