分析仿真中的 AI 引擎性能 - 2023.2 简体中文

Versal 自适应 SoC 系统集成和确认方法指南 (UG1388)

Document ID
UG1388
Release Date
2023-11-15
Version
2023.2 简体中文

最终确定应用架构并且 AI 引擎与 PL 之间的设计分区完成后,下一步是开发 AI 引擎应用。您可以使用 aiesimulator 通过追踪剖析功能来测量应用性能。您还可使用 aiesimulator 输出来测量性能。

以下示例中,性能测量方法为 (结束时间 - 开始时间)/样本数,其中:

  • 每一行均表示 1 个 64b 数字 (2 cint16s)。有 51200 个 64b 数字(例如,102400 个 32b 样本)。
  • 吞吐量 = 102400/(182452500 ps - 5790 ns) 样本数/s = 579.636 MSps。
     1 T 5790 ns
     2 0 0 0 0
     3 T 5792500 ps
     4 0 0 0 0
     5 T 5795 ns
     6 0 0 0 0
     7 T 5797500 ps
     8 0 0 0 0
     9 T 5800 ns
...
...
...
102495 -5107 2007 -32768 -18047
102496 T 182450 ns
102497 -25374 -19023 3957 3067
102498 T 182452500 ps
102499 TLAST
102500 18230 14818 11355 -5427

要进一步分析 AI 引擎性能瓶颈,AMD 建议运行 aiesimulator 或硬件仿真(搭配 AI 引擎追踪和剖析选项)。您可以打开为仿真运行所生成的运行汇总文件,其中包含 Vitis 分析器中的追踪数据和剖析数据。这样即可生成追踪视图和剖析视图,以帮助您识别性能根源问题。欲知详情,请访问此链接以参阅 AI 引擎工具和流程用户指南 (UG1076) 中的相应内容。

此外,您可使用 AI 引擎运行时事件 API 获取有关 AI 引擎计算图带宽、吞吐量和时延的详细剖析数据。欲知详情,请访问此链接以参阅 AI 引擎工具和流程用户指南 (UG1076) 中的相应内容。