WeGO TensorFlow 2 で ZenDNN を有効にする方法
ZenDNN は、デフォルトでは無効です。有効にするには、export
TF_ENABLE_ZENDNN_OPTS=1
に設定します。
環境変数
WeGO TensorFlow 2 で ZenDNN を有効にして正しく動作させるには、次の環境変数を明示的にエクスポートする必要があります。
名前 | 説明 |
---|---|
OMP_DYNAMIC | ZenDNN を有効にする場合は、明示的に FALSE に設定してください。 |
OMP_NUM_THREADS | 性能を改善する必要がある場合は、明示的に設定してください。詳細は、チューニング ガイドラインを参照してください。 |
ZENDNN_GEMM_ALGO | デフォルト値は 3 です。[0、1、2、3、4] に設定すると、それぞれ異なる GEMM ALGO パスを調整できます。 |
ZENDNN_TENSOR_POOL_LIMIT | デフォルト値は 32 です。詳細は、チューニング ガイドラインを参照してください。 |
ZENDNN_TENSOR_BUF_MAXSIZE_ENABLE | デフォルト値は 0 です。
|
TF_ENABLE_ZENDNN_OPTS | デフォルト値は 0 です。1 にセットすると、ZenDNN が有効になります。 |
チューニング ガイドライン
OMP_NUM_THREADS
はユーザー システムのコアの数に合わせて設定します。1 または 2 などの小さい値を設定することをAMDは推奨しています。
場合によっては、ZENDNN_TENSOR_POOL_LIMIT
を 1 などの小さい値に設定してください。この場合、ZENDNN_TENSOR_POOL_LIMIT
のプール上限に達すると、一部のレイヤーがテンソル プールではなくデフォルトのメモリ割り当てを使用します。