最终确定应用架构并且 AI 引擎与 PL 之间的设计分区完成后,下一步是开发 AI 引擎应用。您可以使用 aiesimulator
通过追踪剖析功能来测量应用性能。您还可使用 aiesimulator
输出来测量性能。
以下示例中,性能测量方法为 (结束时间 - 开始时间)/样本数,其中:
- 每一行均表示 1 个 64b 数字 (2 cint16s)。有 51200 个 64b 数字(例如,102400 个 32b 样本)。
- 吞吐量 = 102400/(182452500 ps - 5790 ns) 样本数/s = 579.636 MSps。
1 T 5790 ns
2 0 0 0 0
3 T 5792500 ps
4 0 0 0 0
5 T 5795 ns
6 0 0 0 0
7 T 5797500 ps
8 0 0 0 0
9 T 5800 ns
...
...
...
102495 -5107 2007 -32768 -18047
102496 T 182450 ns
102497 -25374 -19023 3957 3067
102498 T 182452500 ps
102499 TLAST
102500 18230 14818 11355 -5427
要进一步分析 AI 引擎性能瓶颈,AMD 建议运行 aiesimulator
或硬件仿真(搭配 AI 引擎追踪和剖析选项)。您可以打开为仿真运行所生成的运行汇总文件,其中包含 Vitis 分析器中的追踪数据和剖析数据。这样即可生成追踪视图和剖析视图,以帮助您识别性能根源问题。欲知详情,请访问此链接以参阅
AI 引擎工具和流程用户指南
(UG1076) 中的相应内容。
此外,您可使用 AI 引擎运行时事件 API 获取有关 AI 引擎计算图带宽、吞吐量和时延的详细剖析数据。欲知详情,请访问此链接以参阅 AI 引擎工具和流程用户指南 (UG1076) 中的相应内容。