标量处理单元 - 2022.1 简体中文

AI 引擎内核编码最佳实践指南 (UG1079)

Document ID

UG1079

Release Date

2022-05-25

Version

2022.1 简体中文

下图显示了标量单元的子组件。标量单元与通用处理器十分相似，同样用于程序控制（分支、比较）、标量数学运算、非线性函数和数据类型转换。与通用处理器一样，标量单元同样可以使用泛用 C/C++ 代码。

图 1. 标量处理单元

寄存器文件用于存储输入和输出。指针算术有专用的寄存器，通用用途和配置也同样如此。特殊寄存器包括栈指针、圆形缓冲器和零开销循环。在 AI 引擎中支持两种类型的标量基本非线性函数，即定点精度和浮点精度。

定点非线性函数包括：

浮点非线性函数包括：

AI 引擎中的算术逻辑单元 (ALU) 用于管理以下运算，运算发出速率为每个周期一条指令。

数据类型转换可使用 aie::to_fixed 和 aie::to_float 来执行。此转换也支持 sqrt、inv 和 inv_sqrt 定点运算。

编译器和标量单元支持程序员使用标准“C”数据类型。下表显示了标准 C 语言数据类型及其精度。除浮点和双精度之外的所有类型都支持有符号前缀和无符号前缀。

重要的是，请谨记控制流语句（例如，分支）仍由标量单元处理，即使存在矢量指令也是如此。此概念对于最大程度提升 AI 引擎性能至关重要。