识别性能瓶颈 - 2022.1 简体中文

Vitis 统一软件平台文档 应用加速开发 (UG1393)

Document ID
UG1393
Release Date
2022-05-25
Version
2022.1 简体中文

在纯顺序应用中,通过查看剖析报告即可轻松识别性能瓶颈。但是,大多数真实应用均为多线程应用,在寻找性能瓶颈时考虑并行度的影响非常重要。

下图显示了含两条并行路径的应用的性能剖析。每个矩形的宽度与每个函数的性能成比例。

图 1. 具有两条并行路径的应用

并行化情境下的上述性能可视化表明,仅对两条路径中的一条进行加速并不能提升应用的总体性能。因为路径 A 和 B 重新收敛,所以它们相互依赖彼此才能完成。同样,即使把 A2 加速 100 倍,也不会对上方路径的性能产生重大影响。因此,该示例中的性能瓶颈是函数 A1、B1、B2 和 B3。

在寻找加速对象时,请考虑整个应用程序的性能,而不仅仅考虑单个函数。