AIE-ML アレイのアーキテクチャ

Versal アダプティブ SoC AIE-ML アーキテクチャ マニュアル (AM020)

Document ID
AM020
Release Date
2023-11-10
Revision
1.2 日本語

このセクションではアレイの違いについて説明します。詳細は、AIE-ML アレイ インターフェイスのアーキテクチャ および 『Versal アダプティブ SoC AI エンジン アーキテクチャ マニュアル』 (AM009)AI エンジン アレイ インターフェイスのアーキテクチャを参照してください。次に、AIE と共通の AIE-ML の主な機能をまとめます。

  • プロセス、電圧、周波数、クロック、および電源分配は同じ
  • アレイ トポロジは同じ (1 つの AIE-ML につき 1 つの VLIW SIMD プロセッサ)
  • AIE-ML タイルには 8 個のデータ メモリ バンクがあり、隣接する 3 つのタイルと共有。
  • AIE-ML タイルには、1 方向につき 2 つの DMA チャネル
  • AIE-ML タイル間のストリーム インターコネクト帯域幅は AIE と同じ
  • PL および NoC インターフェイスは同じ
  • デバッグ/トレース機能は同じ

次に、AIE とは異なる、または AIE から強化された AIE-ML の主な機能をまとめます。

  • タイル レベルで演算性能とメモリ容量が 2 倍に向上。AIE-ML がローカル タイルのメモリ マップド レジスタに直接読み出し/書き込みアクセスを実行できるようにプロセッサ バスが追加されています。
  • タイル/アレイ インターフェイス タイルに対する 3D アドレス生成、メモリ タイルに対する 4D アドレス生成、S2MM のアウトオブオーダー パケットと Finish-on-TLast などの機能を備えた拡張型の DMA を AIE-ML タイル、AIE-ML メモリ タイル、および AIE-ML アレイ インターフェイス タイルに追加。圧縮および圧縮伸張 (タイルおよびメモリ タイル) のサポートにより、CNN および RNN アプリケーションにおけるスパース重みと活性化値の扱いが改善。詳細は、スパース性 を参照してください。
  • AIE-ML メモリ タイル (最大 2 行) の追加により、プログラマブル ロジック (PL) のリソース (LUT および URAM) 使用量が大幅に削減。各メモリ タイルには 512 KB のメモリ (ECC あり) と 12 の DMA チャネル (6 つの MM2S と 6 つの S2MM) があります。
  • AIE-ML タイル内のデータ メモリを倍増し、AIE-ML メモリ タイルを追加したことでメモリ容量が増大。
  • 電力消費効率 (TOPS/W) が改善。
  • ソースからデスティネーションへのパリティ チェックおよび確定的マージなど、ストリーム スイッチの機能が向上。
  • リコンフィギュレーションと同期のサポートが改善。
  • グリッド アレイ アーキテクチャにより、垂直 (上側から下側) および水平 (左側から右側) 方向の 512 ビットカスケード接続をサポート (AIE は水平方向の 384 ビット カスケード接続のみ)。

次の図に示すように、AIE のチェッカーボード アーキテクチャが AIE-ML ではグリッド アーキテクチャに変更されています。特に大きな変更点として、AIE-ML ではタイルの行がすべて同じ方向になっています。カスケード接続は上側から下側、および左側から右側のみです。

図 1. AIE と AIE-ML のアレイ構成