“Save Argmax”(保存 Argmax)选项会在将输出复原回 DDR 空间时沿通道维度启用 argmax 和 max 特征。在某些情况下(如分割),只需最大值的索引即可。此时将模型中的 softmax 替换为 argmax 即可移除 Exp 计算和缩短时延,这是很有用的。
DPUCZDX8G 架构 | 额外 LUT 数 | 额外寄存器数 |
---|---|---|
B512 | 422 | 556 |
B800 | 399 | 547 |
B1024 | 460 | 546 |
B1152 | 503 | 631 |
B1600 | 590 | 640 |
B2304 | 803 | 442 |
B3136 | 832 | 758 |
B4096 | 735 | 389 |