AIE-ML アレイの機能

Versal アダプティブ SoC AIE-ML アーキテクチャ マニュアル (AM020)

Document ID
AM020
Release Date
2023-11-10
Revision
1.2 日本語

AMDはこれまでいくつかの AI エンジンを開発しています。このアーキテクチャ マニュアルでは、特に AIE-ML について詳しく説明します。

一部の Versal アダプティブ SoC は、アレイ状に並んだ AIE-ML タイル、AIE-ML メモリ タイル、および AIE-ML アレイ インターフェイス (ネットワーク オン チップ (NoC) インターフェイス タイルとプログラマブル ロジック (PL) インターフェイス タイルを含む) で構成される AIE-ML を搭載しています。次に、それぞれの機能を示します。アレイの配置は、図 1 に示しています。

AIE-ML タイルの機能

  • プログラマブル ロジック (PL) 外部のシリコンに個別の構築ブロックとして統合。
  • AIE-ML に機械学習など多くのアプリケーションに最適化された高性能 VLIW (Very-Long Instruction Word) SIMD (Single-Instruction Multiple-Data) ベクトル プロセッサを内蔵。
  • ハードウェアの観点からは、64 KB のデータ メモリは 8 KB のバンク x 8 として構成。プログラマの観点からは、バンクを 2 つずつインターリーブして 1 つのバンクを形成 (つまり、全体で 16 KB のバンクが 4 つ存在)。
  • Versal デバイス内の AIE-ML タイルとプログラマブル ロジック間で確定的なスループットおよび高速データフローを実現するストリーミング インターコネクト。
  • AIE-ML タイル内のダイレクト メモリ アクセス (DMA) で受信ストリームからローカル メモリ、およびローカル メモリから送信ストリームへデータを移動。
  • 外部マスターから内部 AIE-ML タイルへアクセスするためのトランザクション ベースの共有スイッチド インターコネクトを備えたコンフィギュレーション インターコネクト (メモリ マップド AXI4 インターフェイス経由)。
  • AIE-ML とタイル DMA 間、および AIE-ML と外部マスター間 (メモリ マップド AXI4 インターフェイス経由) で AIE-ML の同期を実行するハードウェア同期プリミティブ。
  • デバッグ、トレース、およびプロファイル機能。
  • AIE-ML タイルでは、クロック ゲーティングとリセットの粒度が追加されています。AIE-ML タイルのクロック ゲーティングとリセットは、タイル内のメモリ マップド AXI4 レジスタを使用して実行できます。AIE-ML では、メモリ マップド AXI4、クロック ゲーティング、およびリセット レジスタが常時オンのドメインに移動しており、タイル内のコア、ストリーム スイッチ、およびメモリ モジュールに対してモジュールごとの制御が可能となっています。同じことは、AIE-ML のファンクション ユニットの 1 つであるメモリ タイルにも当てはまります。メモリ タイルについては、次のセクションで説明します。

AIE-ML メモリ タイルの機能

  • 高集積度 (512 KB) の広帯域幅メモリを含むタイルにより、機械学習 (ML) アプリケーションにおける PL リソースの使用量を削減します。
  • メモリ タイル DMA のチャネル機能は AIE-ML タイルとほぼ同じですが、メモリ タイル DMA は 4D アドレス指定モードもサポートしています。詳細は、AIE-ML メモリ タイルのアーキテクチャ を参照してください。
  • AXI4-Stream インターコネクトは AIE-ML タイルと同じですが、ポート数と接続が異なります。
  • メモリ マップド AXI4 の構成は AIE-ML タイルと同じです。

NoC および PL リソースへの AIE-ML アレイ インターフェイス

  • AIE-ML NoC インターフェイス タイルのダイレクト メモリ アクセス (DMA) が、AIE-ML アレイとの間で送受信するメモリ マップドおよびストリーム トラフィックを管理します。このインターフェイス タイルは、AIE-ML アレイ インターフェイスのアーキテクチャ で説明します。
  • メモリ マップド AXI4 インターフェイスを経由したコンフィギュレーションおよび制御インターコネクト機能
  • AIE-ML タイルのストリーミング インターコネクト機能を利用するストリーミング インターコネクト。
  • AIE-ML からプログラマブル ロジック (PL) へのインターフェイスにより、AIE-ML クロックと PL クロック間で非同期クロック乗せ換えを実行。
  • AIE-ML から NoC へのインターフェイス ロジックにより、NoC マスター ユニット (NMU) および NoC スレーブ ユニット (NSU) コンポーネントに接続。
  • AIE-ML タイルのロック モジュールの機能を利用したハードウェア同期プリミティブ。
  • AIE-ML タイルのすべての機能を利用したデバッグ、トレース、およびプロファイル機能。
  • AI エンジン (AIE) アレイ インターフェイスから変更点の一覧は、AIE-ML アレイ インターフェイスのアーキテクチャ を参照してください。