使用专用块和宏原语对路径进行最优化 - 2023.2 简体中文

Versal 自适应 SoC 系统集成和确认方法指南 (UG1388)

Document ID
UG1388
Release Date
2023-11-15
Version
2023.2 简体中文

专用块与宏原语之间的路径或者双向往来路径(如 DSP、块 RAM、UltraRAM、NoC 主/从单元 (NMU/NSU)、AI 引擎和 XPIO)需特别关注,因为这些原语通常具有如下时序特性:

  • 部分管脚的建立时间、保持时间或时钟输出 (clock-to-output) 时序 arc 值较高。例如,块 RAM 的时钟输出延迟分别约为 1.2 ns(无可选输出寄存器)和 0.3 ns(含可选输出寄存器)。请复查目标器件系列的数据手册以了解详情。
  • NoC 输出管脚的时钟输出时序 arc 值较高。例如,NoC NSU 的时钟输出延迟约为 0.65 ns。
  • 布线延迟比常规 FD/LUT 连接更高。
  • 时钟偏差变化比常规 FD-FD 路径更高。
  • 互连结构与器件顶层或底层的专用块(例如,XPIO 中的 AI 引擎和专用块,包括 XPHY 逻辑块、I/O 逻辑块和时钟修改块等)之间的布线延迟更高。

此外,相比于 CLB slice,其可用性和站点位置均受到限制,这导致其布局更为困难并产生 QoR 惩罚。

有鉴于此,AMD 建议如下:

  • 尽可能采用流水线路径作为往来专用块与宏原语之间的路径。
  • 重构连接到这些单元的组合逻辑,以将逻辑级数降低至少 1 或 2 个单元(前提是因流水打拍所产生的时延过大)。
  • 布局之前,在这些路径上满足建立时序要求并超出至少 500 ps。
  • 复制连接到过多专用块或宏原语的逻辑椎,以便按需将其布局在相隔较远的位置。
  • 如果设计对于 DSP 块内部或往来 DSP 块的时序要求较为苛刻,请运行 opt_design -dsp_register_opt 以将寄存器移至更接近时序最优化的位置。
    注释: 由于在 opt_design 期间时序为近似估算,您可能还需要运行 phys_opt_design -dsp_register_opt 来更正在预布局阶段未准确呈现时序的移动操作。
  • 使用边界逻辑接口 (BLI) 触发器进行流水线触发器的布局,这些触发器可用于与 XPIO 中的 AI 引擎和专用块(如 XPHY 逻辑块、I/O 逻辑块和时钟修改块等)进行交互。部分 IP 可提供使用 BLI 触发器的选项。