WeGO TensorFlow 2 での ZenDNN - 3.5 日本語

Vitis AI ユーザー ガイド (UG1414)

Document ID
UG1414
Release Date
2023-09-28
Version
3.5 日本語

WeGO TensorFlow 2 で ZenDNN を有効にする方法

ZenDNN は、デフォルトでは無効です。有効にするには、export TF_ENABLE_ZENDNN_OPTS=1 に設定します。

環境変数

WeGO TensorFlow 2 で ZenDNN を有効にして正しく動作させるには、次の環境変数を明示的にエクスポートする必要があります。
表 1. 環境変数
名前 説明
OMP_DYNAMIC ZenDNN を有効にする場合は、明示的に FALSE に設定してください。
OMP_NUM_THREADS 性能を改善する必要がある場合は、明示的に設定してください。詳細は、チューニング ガイドラインを参照してください。
ZENDNN_GEMM_ALGO デフォルト値は 3 です。[0、1、2、3、4] に設定すると、それぞれ異なる GEMM ALGO パスを調整できます。
ZENDNN_TENSOR_POOL_LIMIT デフォルト値は 32 です。詳細は、チューニング ガイドラインを参照してください。
ZENDNN_TENSOR_BUF_MAXSIZE_ENABLE デフォルト値は 0 です。
  • 0: メモリ プールの小さいテンソルを有効にする。
  • 1: メモリ プールの大きいテンソルを有効にする。
TF_ENABLE_ZENDNN_OPTS デフォルト値は 0 です。1 にセットすると、ZenDNN が有効になります。

チューニング ガイドライン

OMP_NUM_THREADS はユーザー システムのコアの数に合わせて設定します。1 または 2 などの小さい値を設定することをAMDは推奨しています。

場合によっては、ZENDNN_TENSOR_POOL_LIMIT を 1 などの小さい値に設定してください。この場合、ZENDNN_TENSOR_POOL_LIMIT のプール上限に達すると、一部のレイヤーがテンソル プールではなくデフォルトのメモリ割り当てを使用します。