在 WeGO TensorFlow 2 中启用 ZenDNN
默认禁用 ZenDNN。设置 export
TF_ENABLE_ZENDNN_OPTS=1
以将其启用。
环境变量
您必须显式导出以下环境变量才能在 WeGO TensorFlow 2 中启用并正确运行 ZenDNN。
名称 | 描述 |
---|---|
OMP_DYNAMIC | 启用 ZenDNN 时,请将该变量显式设为 FALSE。 |
OMP_NUM_THREADS | 显式设置该变量以达成更好的性能。请参阅调谐准则以获取更多详细信息。 |
ZENDNN_GEMM_ALGO | 默认值为 3。您可设置 [0, 1, 2, 3, 4] 来调整不同 GEMM ALGO 路径。 |
ZENDNN_TENSOR_POOL_LIMIT | 默认值为 32。请参阅调谐准则以获取更多详细信息。 |
ZENDNN_TENSOR_BUF_MAXSIZE_ENABLE | 默认值为 0。
|
TF_ENABLE_ZENDNN_OPTS | 默认值为 0。设为 1 启用 ZenDNN。 |
调谐准则
根据用户系统的核数设置 OMP_NUM_THREADS
。AMD 建议设置较小的数值,如 1 或 2。
在某些情况下,请将 ZENDNN_TENSOR_POOL_LIMIT
设为较小的数值,如 1,这样某些层会在张量池达到 ZENDNN_TENSOR_POOL_LIMIT
的池限值时,使用默认存储器分配代替张量池。