步骤 3:PL 内核分析 - 2022.1 简体中文

Versal ACAP AI 引擎编程环境 用户指南 (UG1076)

Document ID
UG1076
Release Date
2022-05-25
Version
2022.1 简体中文

此阶段的目标是准确判定导致吞吐量下降的 PL 内核。

图 1. PL 内核分析

以下章节列出了此阶段可用的不同技巧。

使用 PL 剖析监控器进行剖析

您可使用 v++ 链接命令插入 PL 剖析监控器。这样您即可监控活动周期、停滞周期以及特定 PL-AI 引擎接口上传输的字节。在 AI 引擎中可将其搭配事件追踪一起启用以缩短构建时间。这样您即可识别导致性能下降的具体 PL 内核。如需了解有关添加 PL 剖析监控器的选项的更多信息,请参阅 Vitis 统一软件平台文档:应用加速开发(UG1393) 中的 --profile 选项

替换 PL 内核

您可将怀疑导致性能下降的每个 PL 内核都替换为非节流 PL 内核。这样您即可判定 PL 内核是否导致性能下降。

插入 ILA 以监控特定 AXI 接口

您可插入一个或多个 ILA 以监控特定 PL AXI 接口,这样有助于准确识别发生吞吐量下降的位置和时间。它还将帮助您识别吞吐量下降发生的频率。如需了解有关使用 v++ 命令行插入 ILA 的选项的详细信息,请参阅 Vitis 统一软件平台文档:应用加速开发(UG1393) 中的启用内核以利用 Chipscope 进行调试

下一阶段:判定吞吐量下降的原因并修复问题后,继续执行阶段 1 以重新运行设计。