アレイ インターフェイスの DMA メモリ マップド AXI4 マスター インターフェイス

Versal アダプティブ SoC AIE-ML アーキテクチャ マニュアル (AM020)

Document ID
AM020
Release Date
2023-11-10
Revision
1.2 日本語

AIE-ML アレイ インターフェイス DMA は、外部メモリへの直接アクセスが可能です。DMA は AXI4 マスターで、NoC NMU インターフェイスに対して (すなわち、NoC の構成によりパスが通じている Versal デバイス上の任意の AXI4 スレーブに対して) 読み出しおよび書き込み要求を発行できます。DMA の開始アドレスは 32 ビット境界に揃える必要があります。各 DMA チャネルはバッファー ディスクリプター (BD) 内のベース アドレスに基づいてアドレスを生成します。BD には BD 呼び出し間のインクリメンタル アドレス オフセットが格納され、以後のバッファー転送に対して BD を再設定する必要がありません。

DMA は 4 つの独立したチャネル、すなわち 2 つの MM2S (外部メモリからの読み出し) と 2 つの S2MM (外部メモリへの書き込み) で構成されます。各チャネルは 1 サイクルあたり 4 バイト (1 GHz で 4 Gb/s) のスループットを持続でき、合計ではインターフェイス タイルあたり最大 8 Gb/s の読み出しと 8 Gb/s の書き込みを並列に実行できます。

MM2S チャネル (合計 2 つ):

  • 各チャネルに 32 ビットのストリーム マスター インターフェイス
  • 128 ビット AXI4 マスター読み出しインターフェイスを 2 チャネルで共有
  • 4D テンソル アドレス生成 (iteration-offset を含む)
  • アクセス共有型のロック モジュール (インターフェイス タイルのローカル モジュール)
  • タスク キューとタスク完了トークンをサポート。キューの深さはチャネルあたり 4 タスク (詳細は タスク完了トークン 参照)

S2MM チャネル (合計 2 つ)

  • 各チャネルに 32 ビット ストリーム スレーブ インターフェイス
  • 128 ビット AXI4-MM マスター書き込みインターフェイスを 2 チャネルで共有
  • 4D テンソル アドレス生成 (iteration-offset を含む)
  • アクセス共有型のロック モジュール (インターフェイス タイルのローカル モジュール)
  • タスク キューとタスク完了トークンをサポート。キューの深さはチャネルあたり 4 タスク (詳細は タスク完了トークン 参照)
  • アウトオブオーダー パケット転送、Finish-on-TLAST をサポートし、外部メモリに中間結果を圧縮してスピルおよびリストアが可能

バッファー ディスクリプター (BD):

  • 16 個の共有 BD

インターフェイス DMA とタイルおよびメモリ タイル DMA、ならびにストリーミング インターコネクトは、次のデータフローをサポートします (代表的なもののみを記載)。

  • 外部メモリからメモリ タイルへのバッファー コピー
  • 外部メモリから AIE-ML タイルのデータ メモリへのバッファー コピー
  • メモリ タイルから外部メモリへのバッファー コピー
  • AIE-ML タイルのデータ メモリから外部メモリへのバッファー コピー