32x32 位上的 MAC - 2022.1 简体中文

AI 引擎内核编码 最佳实践指南 (UG1079)

Document ID
UG1079
Release Date
2022-05-25
Version
2022.1 简体中文

下图显示了 startoffsetsstep 在 cint16 数据类型上的工作方式。

图 1. cint16 x cint16 类型上的 MAC4

mac4 具有 4 条输出通道。第一列数据的选择方式是将 xoffsets 的每 4 个位与 xstart 相加。后续列的数据的选择方式是将 xstep 与其前一列相加。在 表 1 中,可以看到,对于 cint16 * cint16 运算,每个周期有 8 项 MAC。这表示 mac4 具有两列乘法。

mac4 的选择方式也是相似的,使用 zstartzoffsetzstep 来选择。