确定器件中可以例化和应该例化的内核数量 - 2022.1 简体中文

Vitis 统一软件平台文档 应用加速开发 (UG1393)

Document ID
UG1393
Release Date
2022-05-25
Version
2022.1 简体中文

如果数据路径无法并行化(或无法充分并行化),请考虑添加更多内核实例,如 创建内核的多个实例 中所述。这通常被称为使用多个计算单元 (CU)。

添加更多内核实例可允许对目标函数并行执行更多次调用,从而提升应用性能,如下所示。多个数据集将由不同的实例同时处理。应用性能与实例数量呈线性关系,前提是主机应用可以使内核保持忙碌。

图 1. 使用多个计算单元提高性能

使用多个计算单元教程中所示,Vitis 技术通过添加更多实例来简化性能的缩放调整。

至此,开发者应该能够更准确地理解硬件中满足性能目标所需的并行度,并且能够通过数据路径宽度与内核实例的组合来理解实现此并行度的方式。