AI 引擎拼块 DMA 性能 - 2023.2 简体中文

AI 引擎内核与计算图编程指南 (UG1079)

Document ID
UG1079
Release Date
2023-12-04
Version
2023.2 简体中文

AI 引擎和 PL 吞吐量接近最大值的高吞吐量的用例中,使用 DMA FIFO 时,PL 与 DMA FIFO 通信时采用的是异步 PL 到 AI 引擎时钟关系,由于单个 DMA FIFO 的性质,读取侧必须不时等待数据。这可能导致 AI 引擎上的吞吐量略低于 100%。以下提供了一些有助于避免少量损失吞吐量的建议方法。

  • 在裕量不高于 40 的串流连接上,所选 fifo_depth 约束在 AI 引擎到 PL 边界处不高于 40。
  • 在 PL 中添加小型异步 FIFO 以将对齐相移到 AI 引擎时钟域中。
  • 对于 PL 到 AI 引擎的连接,使用同步时钟。使用来自 PL 的 128 位 AXI4‑Stream 接口,并且使用的 PL 时钟应为 AI 引擎频率的整数倍。