AI エンジン デザインが大規模化するにつれて、デザイン実行中に生成されたイベントを追跡することは、パフォーマンス ボトルネックの特定だけでなく、AI エンジン デザイン全体の動作を把握するのにも有益です。大規模デザインでは、より多くのイベントが生成されるので、使用するトレース IP で記録されるイベントのボトルネックが発生します。このデータをすべて効率的かつ迅速に収集するには、複数のイベント トレース ストリームをインスタンシエートすることを検討する必要があります。これらのストリームは、AI エンジンからのイベント データを分散し、それらを正しく適時に格納できるようにします。
デザインのトレース ストリームを拡張するには、aiecompiler --num-trace-streams
オプションを使用します。このオプションの値は、1 ~ 16 の範囲です。次の表では、デザインのサイズに応じて推奨されるトレース ストリーム数を示しています。
AI エンジンの数 | 推奨されるストリーム数 |
---|---|
10 以下 | 1 |
10 ~ 20 | 2 |
20 ~ 40 | 4 |
40 ~ 80 | 8 |
80 以上 | 16 |
|
AI エンジンのコンパイラ オプションを変更した後には、 『Vitis 統合ソフトウェア プラットフォーム資料: アプリケーション アクセラレーション開発』 (UG1393) のシステムのリンクで説明しているとおり、Vitis コンパイラと config ファイルを使用して、XCLBIN ファイルと libadf.a に対して再コンパイルと再リンクを実行します。
v++ -l --config system.cfg ...