WeGO TensorFlow 2 中的 ZenDNN - 3.5 简体中文

Vitis AI 用户指南 (UG1414)

Document ID
UG1414
Release Date
2023-09-28
Version
3.5 简体中文

在 WeGO TensorFlow 2 中启用 ZenDNN

默认禁用 ZenDNN。设置 export TF_ENABLE_ZENDNN_OPTS=1 以将其启用。

环境变量

您必须显式导出以下环境变量才能在 WeGO TensorFlow 2 中启用并正确运行 ZenDNN。
表 1. 环境变量
名称 描述
OMP_DYNAMIC 启用 ZenDNN 时,请将该变量显式设为 FALSE。
OMP_NUM_THREADS 显式设置该变量以达成更好的性能。请参阅调谐准则以获取更多详细信息。
ZENDNN_GEMM_ALGO 默认值为 3。您可设置 [0, 1, 2, 3, 4] 来调整不同 GEMM ALGO 路径。
ZENDNN_TENSOR_POOL_LIMIT 默认值为 32。请参阅调谐准则以获取更多详细信息。
ZENDNN_TENSOR_BUF_MAXSIZE_ENABLE 默认值为 0。
  • 0:启用减小存储器池张量。
  • 1:启用增大存储器池张量。
TF_ENABLE_ZENDNN_OPTS 默认值为 0。设为 1 启用 ZenDNN。

调谐准则

根据用户系统的核数设置 OMP_NUM_THREADSAMD 建议设置较小的数值,如 1 或 2。

在某些情况下,请将 ZENDNN_TENSOR_POOL_LIMIT 设为较小的数值,如 1,这样某些层会在张量池达到 ZENDNN_TENSOR_POOL_LIMIT 的池限值时,使用默认存储器分配代替张量池。