AIE と同様、AIE-ML の AI エンジン プロセッサもスカラー 32 ビット データパス、SIMD ベクトル データパス、2 つのロード ユニット、1 つのストア ユニットで構成され、ML アプリケーションに最適化されています。
次に、AIE-ML プロセッサの機能を示します。
- 命令ベースの VLIW SIMD プロセッサに新しい命令を追加
- AIE と同じ 16 KB プログラム メモリ
- ベクトル ユニットは 256 (8b x 8b) および 512 (4b x 8b) MAC 演算をサポート
- ベクトル ユニットは FP32 累算を使用した 128 の bloat16 MAC 演算をサポート
- ベクトル ユニットは cint32 x cint16 乗算 (cint32 のデータと cint16 の回転因子)、複素数と共役の制御サポート、新しい並べ替えモード、およびシャッフル モードなど、ML 推論用にスパース構造および FFT 処理をサポート。詳細は、スパース性 を参照してください。
- 新しいプロセッサ バスにより、プロセッサからローカル AIE-ML タイル内のメモリ マップド レジスタへのアクセスが可能
- 複雑な循環アドレス指定モードの代わりに 3D アドレス指定モードを導入
- スパース型の重みのロード時にオンザフライで圧縮を伸張。詳細は、スパース性 を参照してください。
AIE-ML プロセッサでは、AIE プロセッサで使用されていた高度な DSP 機能がいくつか削除されています。これには次のものが含まれます。
- 32 ビット浮動小数点ベクトル データパスは直接サポートされず、複数の 16 x 16 ビット乗算に分解することでエミュレーションによりサポート
- sin/cos、sqrt、inverse sqrt および inverse などのスカラー非線形関数
- スカラー浮動小数点/整数変換
- 複雑な環状アドレス指定および FFT アドレス指定モード。ただし、FFT と複素数はある程度までサポートされます。詳細は、AIE-ML プロセッサの機能を参照してください。
- 128 ビット ロード/ストアを制限付きでサポート
- アライメントなしのメモリ アクセス
- いくつかの複素数データ型をサポート。複素数はある程度までサポートされます。詳細は、AIE-ML プロセッサの機能を参照してください。
- 32 × 32 乗算のネイティブ サポート。ただし 16 ビット整数オペランドを使用してエミュレーション可能
- ノンブロッキング 128 ビット ストリーム インターフェイスおよびストリーム FIFO を廃止
- 制御ストリームおよびパケット ヘッダー生成