オーバーヘッドの少ないプラグインをイネーブルにするには、xrt.ini ファイル の「デバッグ」セクションに示すように lop_trace
という新しいオプションを使用します。デフォルトでは、lop_trace
は FALSE なので、イネーブルにする場合は ini
パラメーターを TRUE に設定する必要があります。
xrt.ini file
[Debug]
lop_trace=true
lop_trace
パラメーターはほかのパラメーターと一緒に使用することはできますが、それにより、オーバーヘッドの多くなるプロファイリング部分すべてを含めることになり、オーバーヘッドを少なくするメリットがなくなってしまうことがあります。
lop_trace=true
でイネーブルになると lop_trace.csv が生成され、ランタイムを視覚化できますす。vp_analyze
コマンドを使用して wdb/wcfg ファイルを生成し、Vitis アナライザー内で視覚化できるようにします。
vp_analyze lop_trace.csv
最小限のオーバーヘッドを取得するため、標準の OpenCL プロファイリングで収集される情報は省かれます。特に、オーバーヘッドの少ないプロファイリング トレースでは次の情報含まれません。
- 計算ユニット実行またはカーネル メモリ転送などのデバイス イベント
- デスティネーション アドレスまたはサイズなどのメモリ読み出しまたは書き込みに関する情報
- カーネル名や NDRange サイズなどのカーネル エンキューに関する情報
- バッファー転送とカーネル エンキュー間の依存
lop_trace
パラメーターはほかのパラメーターと一緒に使用することはできますが、それにより、オーバーヘッドの多くなるプロファイリング部分すべてを含めることになり、オーバーヘッドを少なくするメリットがなくなってしまうことがあります。プロファイリングおよび lop_trace
オプションを一緒に使用すると、標準出力でメッセージが表示されます。