DPUCVDX8H でサポートされる機能 - 1.1 日本語

たたみ込みニューラル ネットワークにおける DPUCVDX8H 製品ガイド (PG403)

Document ID
PG403
Release Date
2023-01-23
Version
1.1 日本語

DPU IP は、複数の固定されたコンフィギュレーションを XO ファイルで提供します。コンフィギュレーションには、プロセッシング エンジンの数、要素ごとの異なるカーネル/フィルター サイズ、プーリングなどが含まれます。

次の表に、DPU でサポートされるディープ ニューラル ネットワークと関連パラメーターを示します。

表 1. DPU でサポートされる DNN の機能とパラメーター
機能 説明 (channel_parallel=64、bank_depth=256)
たたみ込み カーネル サイズ W, H: [1, 16]
ストライド W, H: [1, 4]
Pad_left/Pad_right [0, (kernel_w - 1) * dilation_w]
Pad_top/Pad_bottom [0, (kernel_h - 1) * dilation_h]
入力サイズ kernel_w * kernel_h * ceil(input_channel / channel_parallel) <= bank_depth
出力サイズ output_channel <= 256 * channel_parallel
アクティベーション ReLU、LeakyReLU、ReLU6、Hard-Swish、Hard-Sigmoid
Dilation dilation * input_channel <= 256 * channel_parallell
depthwise-conv2d 1 カーネル サイズ W, H: [1, 8]
ストライド W, H: [1, 4]
Pad_left/Pad_right [0, (kernel_w - 1) * dilation_w + 1]
Pad_top/Pad_bottom [0, (kernel_h - 1) * dilation_h + 1]
In Size kernel_w * kernel_h * ceil(input_channel / channel_parallel) <= bank_depth
Out Size output_channel <= 256 * channel_parallel
アクティベーション ReLU、ReLU6
Dilation dilation * input_channel <= 256 * channel_parallell
transposed-conv2d カーネル サイズ kernel_w/stride_w、kernel_h/stride_h: [1, 16]
Strides
Pad_left/Pad_right [1, kernel_w-1]
Pad_top/Pad_bottom [1, kernel_h-1]
Out Size output_channel <= 256 * channel_parallel
アクティベーション ReLU、LeakyReLU、ReLU6、Hard-Swish、Hard-Sigmoid
depthwise-transposed-conv2d 1 カーネル サイズ kernel_w/stride_w、kernel_h/stride_h: [1, 8]
Strides
Pad_left/Pad_right [1, kernel_w-1]
Pad_top/Pad_bottom [1, kernel_h-1]
Out Size output_channel <= 256 * channel_parallel
アクティベーション ReLU、ReLU6

max-pooling/

average-pooling

(PL 内の MISC ユニット)

カーネル サイズ

2/4/6pe: W,H: [1, 8] W==H

8pe_normal: W,H:{1,2,3,7} W==H

ストライド W: [1, 8] H: [1, 8]
Pad_left/Pad_right [1, kernel_w-1]
Pad_top/Pad_bottom [1, kernel_h-1]
アクティベーション サポートしない
elementwise-sum

(PL 内の MISC ユニット)

入力チャネル input_channel <= 256 * channel_parallel
アクティベーション ReLU

max-pooling/

average-pooling

(AI エンジン 上の MISC ユニット)

カーネル サイズ 2/4/6/8pe: W,H: [1, 128]
ストライド W: [1, 128] H: [1, 128]
Pad_left/Pad_right [1, kernel_w-1]
Pad_top/Pad_bottom [1, kernel_h-1]
アクティベーション サポートしない
elementwise-sum

(AI エンジン 上の MISC ユニット)

入力チャネル input_channel <= 128 * channel_parallel
アクティベーション ReLU、Hard-Sigmoid
elementwise-multi

(AI エンジン 上の MISC ユニット)

入力チャネル input_channel <= 128 * channel_parallel
アクティベーション ReLU、Hard-Sigmoid
各種構成は次のとおりです。
  1. 8pe_normal: depthwise と PL 内の MISC ユニットをサポートしていません。
  2. 6pe_dwc: AIE 上の depthwise と PL 内の MISC ユニット。
  3. 6pe_misc: depthwise と AIE 上の MISC ユニットをサポートしていません。
  4. 4pe_miscdwc/2pe_miscdwc: AIE 上の depthwise と MISC ユニット。