理论峰值性能指标 - 1.2 简体中文

适用于 Versal ACAP 的 DPUCVDX8G 产品指南 (PG389)

Document ID
PG389
Release Date
2022-06-24
Version
1.2 简体中文

下表显示了含 15 种架构的 DPUCVDX8G 的理论峰值性能。这些指标假定 PL 频率为 333MHz,AIE 频率为 1.25 GHz。

表 1. DPUCVDX8G 的理论峰值性能
架构 理论峰值性能 (TOPS)
C32B1CU1L2S2 10.24
C32B1CU2L2S2 20.48
C32B1CU3L2S2 30.72
C32B2CU1L2S2 20.48
C32B3CU1L2S2 30.72
C32B4CU1L2S2 40.96
C32B5CU1L2S2 51.20
C32B6CU1L2S2 61.44
C64B1CU1L2S2 20.48
C64B1CU2L2S2 40.96
C64B1CU3L2S2 61.44
C64B2CU1L2S2 40.96
C64B3CU1L2S2 61.44
C64B4CU1L2S2 81.92
C64B5CU1L2S2 102.4
  1. 单个 AI 引擎每个时钟周期的峰值运算数量为 256。因此,总计理论峰值性能计算方式为 256 * CPB_N * BATCH_N * CU_N * AIE 频率,其中:

    CPB_N = 每个批处理程序的 AIE 数量 (C64)

    BATCH_N = 最大批次大小 (B5)

    CU_N = 特定 DPU 架构的 CU 数量 (1)

    示例:C64B5CU1L2S2

    峰值 TOP = 256 * 64 * 5 * 1 * 1.25 GHz

    峰值 TOP = 102.4