如 在应用中启用剖析 中所述,在 xrt.ini 文件中启用特定选项(例如,opencl_trace
、xrt_native_api
和 device_trace
)时,Xilinx Runtime (XRT) 会收集有关主机应用与内核的剖析数据。XRT 会在通过 OpenCL 或 XRT API 调用来调用运行时的过程中,为主机应用捕获剖析数据。您还可以向自己的主机应用添加用户调用,以捕获更多剖析信息,如 主机应用的定制剖析 中所述。要捕获内核操作的详细信息,必须使用 --profile 选项 在 .xclbin 中实现内核,请参阅下一章节获取相关说明。
应用完成运行后,Profile Summary(剖析汇总)报告将另存为 .csv 文件,并保存在用于执行已编译的主机代码的目录中。Profile Summary报告可提供有关整体应用性能的详细信息(含注解)。应用执行期间生成的所有数据将按类别进行分组。Profile Summary允许您检验内核执行情况和数据传输统计数据。
提示: 您可为所有构建配置生成Profile Summary报告。但是,对于软件仿真构建,此报告将不包括内核执行效率和数据传输效率方面的任何数据传输详细信息。只有在硬件仿真或系统构建时才会生成这些信息。
以下显示了Profile Summary报告的示例。
图 1. 剖析汇总