まとめ

Versal アダプティブ SoC AIE-ML アーキテクチャ マニュアル (AM020)

Document ID
AM020
Release Date
2023-11-10
Revision
1.2 日本語
表 1. AIE と AIE-ML の主な違いのまとめ
  AIE AIE-ML 1
アレイ構造 チェッカーボード すべての行が同じ
カスケード インターフェイス 384 ビット幅

水平方向

512 ビット幅

水平および垂直方向

タイル ストリーム インターフェイス 2 × 32 ビット入力、2 × 32 ビット出力 1 × 32 ビット入力、1 × 32 ビット出力
サイクルあたりのメモリ ロード/ストア 512/256 ビット 512/256 ビット
高度な DSP 機能 あり なし
タイルあたりの INT4 演算数 256 1024 2
タイルあたりの INT8 演算数 256 512
タイルあたりの INT16 演算数 64 128
タイルあたりの INT32 演算数 16 32 4
タイルあたりの bfloat16 浮動小数点演算数 256
タイルあたりの FP32 浮動小数点演算数 16 42 3
タイルあたりのデータ メモリ 32KB 64KB
タイルあたりのプログラム メモリ 16KB 16KB
メモリ タイル 512KB
プログラマブル ロジック (PL) から AIE アレイへの帯域幅 1X 1X
タイルのローカル メモリ DMA 次をサポート
  • 3D アドレス指定モード
  • S2MM の Finish-on-TLAST とアウトオブオーダー パケット
  • 圧縮/伸長
ローカル メモリ ロック ブール型 セマフォ
  1. スパース性のない場合、および ML アプリケーションの場合。詳細は、スパース性 を参照してください。
  2. 実際には INT8 x INT4 です。
  3. エミュレーション モード: この値で仮数部の精度は 16b となります。仮数部の精度がこれより高い場合、この値は小さくなります。
  4. int32 x int32 はエミュレーションによってサポートされます。