使用 --txt
或 --txt_summary
选项时,vaitrace 将打印 ASCII 表,如下图所示:
图 1. ASCII 表
以下列表中定义了这些字段:
- DPU Id
- DPU 实例的名称。
- Bat
- DPU 实例的批次大小。
- SubGraph
- XMODEL 中的子计算图名称。
- WL (Workload)
- 计算工作负载(MAC 指示 2 次运算)。单位为 GOP。
- RT (Runtime)
- 以毫秒表示的执行时间,单位是 ms。
- Perf
- DPU 性能(以每秒 GOP 数为单位)。单位为 GOP/秒。
- LdFM (Load Size of Feature Map)
- 特征映射的外部存储器加载大小。单位为 MB。
- LdWB (Load Size of Weight and Bias)
- 偏差和权重的外部存储器负载大小。单位为 MB。
- StFM (Store Size of Feature Map)
- 特征映射的外部存储器存储大小。单位为 MB。
- AvgBw (Average bandwidth)
- DDR 存储器访问平均带宽。
AvgBw =(子计算图的总负载大小(包括特征映射和权重/偏差,从 DDR/HBM 到 DPU bank mem)+ 子计算图的总存储大小(从 DPU bank mem 到 DDR/HBM))/ 子计算图运行时间