解读剖析汇总 - 2023.2 简体中文

Vitis 统一软件平台文档 应用加速开发 (UG1393)

Document ID
UG1393
Release Date
2023-12-13
Version
2023.2 简体中文

“Profile Summary”(剖析汇总)包含主机应用和内核的大量实用统计数据。此报告能够笼统展示您应用中的功能瓶颈。

提示: 在“Analysis”视图中查看表格时,您可将鼠标悬停在任意字段上,获取字段内容的定义。

Settings(设置)

显示此报告和 XRT 配置设置。

Summary(汇总)

显示汇总统计数据,包括器件执行时间和器件电源。

Kernels & Compute Units(内核与计算单元)

显示已调度和已执行的所有内核功能的剖析汇总数据。

Kernel Data Transfers(内核数据传输)

显示内核到全局存储器的数据传输,内核到全局存储器的顶层数据传输以及数据传输串流。

Host Data Transfers(主机数据传输)

显示主机与器件存储器之间通过 PCI Express® 链路的所有写入传输的剖析数据、主机与器件存储器之间通过 PCI Express® 链路的所有读取传输的剖析数据以及主机到全局存储器的数据传输。

API Calls(API 调用)

显示在主机应用中执行的所有 OpenCL 主机 API 函数调用的剖析数据。顶部显示的条形图表示 API 调用时间占总时间的百分比。

Device Power(器件功耗)

显示器件功耗的剖析数据。

Kernel Internals(内核内部)

显示以微秒 (µs) 为单位的计算单元运行时间,并报告停滞时间占运行时间的百分比。“Profile Summary”的这部分显示了计算单元上特定端口的数据传输、计算单元上功能端口的数据传输以及计算单元上的运行时间和停滞。

提示: “Kernel Internals”选项卡报告以 µs 为单位的时间,而“Profile Summary”报告其余部分则以毫秒 (ms) 为单位来报告时间。

Shell Data Transfers(shell 数据传输)

下表显示 DMA 数据传输。

提示: 对于 DMA 旁路和全局存储器到全局存储器数据传输,请参阅“Kernel Internals”中的“DMA 数据传输”表。

NoC Counters(NoC 计数)

提示: 除非在实现期间特意生成此数据,否则此数据不予显示。

NoC 计数器显示的是 NoC 计数器读取和 NoC 计数器写入信息。仅当存在非零 NoC 计数器数据时,才会显示这些部分。

每个部分都有 1 个表,其中包含汇总数据以及传输速率和时延的折线图。这些图形可包含多个 NoC 计数器,以便您通过该表格的“Chart”(图表)列中的复选框来开关计数器。

根据设计,可能可以将 NoC 计数器关联到 CU 端口。在此情况下,CU 端口会显示在表格中,选中此端口即可对系统框图、剖析汇总以及包含 CU 端口作为可选对象的任何其他视图进行交叉探测。

AI Engine Counters(AI 引擎计数)

如果存在非零 AI 引擎计数器数据,就会显示 AI 引擎计数器。如果存在不兼容的 AI 引擎计数器配置,则这部分会显示 1 条消息称此配置不支持性能剖析。“Profile Summary”的这部分包含 3 个小节:

  • AI 引擎和存储器
  • 接口通道
  • 存储器通道
注释: 如需了解更多信息,请参阅 AI 引擎工具和流程用户指南 (UG1076)