AI エンジンのパフォーマンスの向上 - 2023.2 日本語

Versal アダプティブ SoC システム統合および検証設計手法ガイド (UG1388)

Document ID
UG1388
Release Date
2023-11-15
Version
2023.2 日本語

AI エンジン グラフおよびカーネルのパフォーマンスをプロファイルし、改善するための手法は複数あります。

ザイリンクス ®ランタイム (XRT) API を使用して、プラットフォーム I/O ポートの帯域幅、グラフのスループット、グラフのレイテンシなどのパフォーマンス メトリクスを計測できます。Vivado IDE を使用して、I/O ポートをインポート、作成、および設定できます。AI エンジン グラフ オブジェクトを含むホスト アプリケーション コードでこれらの API を使用します。このオブジェクトは、グラフを初期化、実行、アップデート、および終了するために使用されます。また、これらの API を使用してグラフ オブジェクトをプロファイリングし、帯域幅、スループット、およびレイテンシを計測できます。詳細は、 『AI エンジン ツールおよびフロー ユーザー ガイド』 (UG1076)このセクションを参照してください。

AI エンジンのパフォーマンス解析には、欠落または不一致ロック、バッファー オーバーラン、ダイレクト メモリ アクセス (DMA) バッファーの間違ったプログラムなど、通常システム パフォーマンス問題に関連しています。メモリ/コア ストール、デッドロック、およびホット スポット解析も含まれます。AI エンジン アーキテクチャでは、シミュレーション、ハードウェア エミュレーション、またはハードウェア実行中にイベントをトレース データとして生成、収集、およびストリーミングできます。このデータを、機能的な問題、カーネル間のレイテンシ、メモリ ストール、デッドロックなどの解析に使用できます。詳細は、次を参照してください。

AI エンジン API と組み込み関数

AI エンジン API は、AI エンジン アクセラレータ用の移植可能なプログラミング インタフェースです。効率的な低位組み込み関数に変換されるデータ型および演算を提供する C++ ヘッダーのみのライブラリとしてインプリメントされます。AMD では、デザインに AI エンジン API を使用することを強くお勧めします。組み込み関数の使用は、デザインの厳しいパフォーマンス要件のため AI エンジン API では提供されない機能を必要とする場合にのみ考慮してください。たとえば、AI エンジン API では、現在のところ、fft_data_incrcyclic_add などの組み込み関数で提供される機能はサポートされていません。AI エンジン API では主な並べ替えのユース ケースがサポートされ、抽象化されていますが、並べ替えのすべての機能が提供されているわけではありません。組み込み関数を使用すると、デザインに必要なパフォーマンスを達成しやすくなることがあります。

AI エンジン API および組み込み関数の使用に関する詳細は、 『AI エンジン カーネルおよびグラフ プログラミング ガイド』 (UG1079) を参照してください。