シリコン上での AI エンジン/PL パフォーマンスのデバッグ

シリコン上での AI エンジン/PL パフォーマンスのデバッグ - 2023.2 日本語

Versal アダプティブ SoC システム統合および検証設計手法ガイド (UG1388)

Document ID

UG1388

Release Date

2023-11-15

Version

2023.2 日本語

AI エンジン/PL パフォーマンスのデバッグに関する推奨事項は、次のとおりです。

AI エンジングラフを小さいグラフに分割して、シリコン上でのボトルネックを解析します。次に例を示します。
- グラフで AI エンジンおよび PL 内にカーネルがある場合、グラフをサブグラフに分割し、機能とパフォーマンスを検証します。この方法を使用すると、パフォーマンスのボトルネックとなっているエリアを特定できます。
- 計算カーネル (AI エンジンまたは PL 内) が複数の AXI4 ストリームからデータを受信する場合、異なるストリームのデータ到着時間にばらつきがあるために、カーネルのパフォーマンスが低下することがあります。これは、バックプレッシャーが原因であるか、またはグラフの前のカーネルにおける計算の複雑性が異なることが原因である可能性があります。グラフをカーネルレベルで分割し、すべてのストリームで最適なパフォーマンスが得られるかを確認できます。
注記: または、カーネルレベルのパフォーマンス計測およびデバッグを使用して、ボトルネックを解析することもできます。
AI エンジングラフを単純なパススルーシステムに置き換えます。
イベントトレースデバッグ機能を使用して、異なるカーネルのメモリストールをカウントします。詳細は、『AI エンジンツールおよびフローユーザーガイド』 (UG1076) のこのセクションを参照してください。