“Profile Summary”(剖析汇总)包含主机应用和内核的大量实用统计数据。此报告能够笼统展示您应用中的功能瓶颈。
Settings(设置)
显示此报告和 XRT 配置设置。
Summary(汇总)
显示汇总统计数据,包括器件执行时间和器件电源。
Kernels & Compute Units(内核与计算单元)
显示已调度和已执行的所有内核功能的剖析汇总数据。
Kernel Data Transfers(内核数据传输)
显示内核到全局存储器的数据传输,内核到全局存储器的顶层数据传输以及数据传输串流。
Host Data Transfers(主机数据传输)
显示主机与器件存储器之间通过 PCI Express® 链路的所有写入传输的剖析数据、主机与器件存储器之间通过 PCI Express® 链路的所有读取传输的剖析数据以及主机到全局存储器的数据传输。
API Calls(API 调用)
显示在主机应用中执行的所有 OpenCL 主机 API 函数调用的剖析数据。顶部显示的条形图表示 API 调用时间占总时间的百分比。
Device Power(器件功耗)
显示器件功耗的剖析数据。
Kernel Internals(内核内部)
显示以微秒 (µs) 为单位的计算单元运行时间,并报告停滞时间占运行时间的百分比。“Profile Summary”的这部分显示了计算单元上特定端口的数据传输、计算单元上功能端口的数据传输以及计算单元上的运行时间和停滞。
Shell Data Transfers(shell 数据传输)
下表显示 DMA 数据传输。
NoC Counters(NoC 计数)
NoC 计数器显示的是 NoC 计数器读取和 NoC 计数器写入信息。仅当存在非零 NoC 计数器数据时,才会显示这些部分。
每个部分都有 1 个表,其中包含汇总数据以及传输速率和时延的折线图。这些图形可包含多个 NoC 计数器,以便您通过该表格的“Chart”(图表)列中的复选框来开关计数器。
根据设计,可能可以将 NoC 计数器关联到 CU 端口。在此情况下,CU 端口会显示在表格中,选中此端口即可对系统框图、剖析汇总以及包含 CU 端口作为可选对象的任何其他视图进行交叉探测。
AI Engine Counters(AI 引擎计数)
如果存在非零 AI 引擎计数器数据,就会显示 AI 引擎计数器。如果存在不兼容的 AI 引擎计数器配置,则这部分会显示 1 条消息称此配置不支持性能剖析。“Profile Summary”的这部分包含 3 个小节:
- AI 引擎和存储器
- 接口通道
- 存储器通道