AI エンジン タイルの DMA のパフォーマンス - 2023.2 日本語

AI エンジン カーネルおよびグラフ プログラミング ガイド (UG1079)

Document ID
UG1079
Release Date
2023-12-04
Version
2023.2 日本語

AI エンジンおよび PL スループットが最大に近い高スループットのユース ケースでは、DMA FIFO を使用しており、PL から AI エンジンへの非同期クロック関係で PL が DMA FIFO と通信する場合、DMA FIFO が 1 つであるため、読み出し側がデータを待つ必要のある時間があります。これにより、AI エンジンのスループットが 100% を多少下回ります。このスループットの低下を回避するための推奨事項のいくつかを次に示します。

  • スラックが 40 またはそれ以下のストリーミング接続で、AI エンジン - PL 境界で 40 またはそれ以下のfifo_depth 制約を選択します。
  • PL に小型の非同期 FIFO を追加し、アライメントを AI エンジン クロック ドメインにシフトします。
  • AI エンジンに同期 PL クロックを使用します。PL からの 128 ビットの AXI4-Stream インターフェイスを使用し、AI エンジン周波数の整数倍の PL クロックを使用します。