複数のイベント トレース ストリームを使用 - 2023.2 日本語

AI エンジン ツールおよびフロー ユーザー ガイド (UG1076)

Document ID
UG1076
Release Date
2023-12-04
Version
2023.2 日本語

AI エンジン デザインが大規模化するにつれて、デザイン実行中に生成されたイベントを追跡することは、パフォーマンス ボトルネックの特定だけでなく、AI エンジン デザイン全体の動作を把握するのにも有益です。大規模デザインでは、より多くのイベントが生成されるので、使用するトレース IP で記録されるイベントのボトルネックが発生します。このデータをすべて効率的かつ迅速に収集するには、複数のイベント トレース ストリームをインスタンシエートすることを検討する必要があります。これらのストリームは、AI エンジンからのイベント データを分散し、それらを正しく適時に格納できるようにします。

デザインのトレース ストリームを拡張するには、aiecompiler --num-trace-streams オプションを使用します。このオプションの値は、1 ~ 16 の範囲です。次の表では、デザインのサイズに応じて推奨されるトレース ストリーム数を示しています。

表 1. 推奨されるイベント トレース ストリーム数
AI エンジンの数 推奨されるストリーム数
10 以下 1
10 ~ 20 2
20 ~ 40 4
40 ~ 80 8
80 以上 16
  1. PL および DMA チャネル リソースの使用率に影響するので、トレース ストリームの使用は最大 16 までにすることをお勧めします。

AI エンジンのコンパイラ オプションを変更した後には、 『Vitis 統合ソフトウェア プラットフォーム資料: アプリケーション アクセラレーション開発』 (UG1393)システムのリンクで説明しているとおり、Vitis コンパイラと config ファイルを使用して、XCLBIN ファイルと libadf.a に対して再コンパイルと再リンクを実行します。

v++ -l --config system.cfg ...