Softmax - 4.0 简体中文

面向 Zynq UltraScale+ MPSoC 的 DPUCZDX8G 产品指南 (PG338)

Document ID
PG338
Release Date
2022-06-24
Version
4.0 简体中文
该选项支持 softmax 运算符的硬件实现。硬件 softmax 加速器封装在 DPU IP 封装文件内,但它作为独立加速器,具有自己的接口和运行时,并实现 int8 输入和浮点输出数据格式。softmax 的硬件实现速度最高可达 MPSoC 器件上软件实现的 160 倍。如果用户的网络/模型包含 softmax 层并且用户希望改善吞吐量,即可启用该选项。
注释: 硬件 softmax 可支持最多 1023 个类。如果类的数量大于 1023,则可考虑采用 softmax 的软件实现。如需了解更多信息,请参阅 Vitis AI Library 用户指南(UG1354)

启用硬件 softmax 时,会在 DPU IP 封装文件中添加名为 SFM_M_AXI 的 AXI 主接口和名为 sfm_interrupt 的中断端口。softmax 模块使用 m_axi_dpu_aclk 作为 SFM_M_AXI 的源时钟,并将其用于计算。

下表中列出了启用硬件 softmax 加速时所使用的其它资源。

表 1. 搭配 Softmax 使用的额外资源
IP 名称 额外 LUT 额外 FF 额外 BRAM 额外 DSP
Softmax 9580 8019 4 14