プロファイル サマリには、ホスト アプリケーションおよびカーネルに関する有益な統計が多数含まれます。このレポートには、アプリケーションの機能的なボトルネックの概要が示されます。
Settings
レポートおよび XRT のコンフィギュレーション設定を表示します。
Summary
デバイスの実行時間、デバイスの消費電力を含む、サマリ統計を表示します。
Kernels & Compute Units
スケジューリングおよび実行されたすべてのカーネル関数のプロファイル データ サマリを表示します。
Kernel Data Transfers
カーネルからグローバル メモリへのデータ転送、およびカーネルからグローバル メモリへのトップ データ転送、およびデータ転送ストリームを表示できます。
Host Data Transfers
ホストとデバイス メモリ間の PCI Express® リンクを使用したすべての書き込み転送のプロファイル データ、ホストとデバイス メモリ間の PCI Express® リンクを使用したすべての読み出し転送のプロファイル データ、およびホストのグローバル メモリへのデータ転送を表示できます。
API Calls
ホスト アプリケーションで実行されるすべての OpenCL ホスト API 関数のプロファイル データを表示します。上部には、合計時間に対する API 呼び出しの時間の割合が棒グラフで示されます。
Device Power
デバイスの電源のプロファイルを表示します。
Kernel Internals
演算ユニットの実行時間 (µs) と、ストール時間の実行時間に対する割合を表示します。プロファイル サマリのこのセクションは、演算ユニットの特定のポートのデータ転送、演算ユニットの論理ポートのデータ転送、演算ユニットの実行時間およびストールを表示します。
Shell Data Transfers
[DMA Data Transfer] セクションは、DMA データ転送を表示します。
NoC Counters
[NoC Counters] には、[NoC Counters Read] および [NoC Counters Write] が表示されます。これらのセクションは、0 以外の NoC カウンター データがある場合にのみ表示されます。
各セクションには、転送レートと遅延の折れ線グラフとサマリ データを含む表があります。グラフには複数の NoC カウンターを含めることができるため、表の [Chart] 列のチェック ボックスを使用してカウンターのオン/オフを切り替えることができます。
デザインによっては、NoC カウンターを CU ポートに関連付けることができます。この場合、CU ポートが表に表示され、選択すると、システム ダイアグラム、プロファイル サマリ、および CU ポートを選択可能なオブジェクトとして含むその他のビューにクロスプローブされます。
AI Engine Counters
AI エンジン カウンターは、0 以外の AI エンジン カウンター データがある場合に表示されます。AI エンジン カウンターの設定に互換性がない場合、このセクションに、設定がパフォーマンス プロファイリングをサポートしていないことを示すメッセージが表示されます。プロファイル サマリのこのセクションには、次の 3 つのサブセクションが含まれます。
- AI エンジン & メモリ
- インターフェイス チャネル
- メモリ チャネル