DPU IP は、複数の固定されたコンフィギュレーションを XO ファイルで提供します。コンフィギュレーションには、プロセッシング エンジンの数、要素ごとの異なるカーネル/フィルター サイズ、プーリングなどが含まれます。
次の表に、DPU でサポートされるディープ ニューラル ネットワークと関連パラメーターを示します。
機能 | 説明 (channel_parallel=64、bank_depth=256) | |
---|---|---|
たたみ込み | カーネル サイズ | W, H: [1, 16] |
ストライド | W, H: [1, 4] | |
Pad_left/Pad_right | [0, (kernel_w - 1) * dilation_w] | |
Pad_top/Pad_bottom | [0, (kernel_h - 1) * dilation_h] | |
入力サイズ | kernel_w * kernel_h * ceil(input_channel / channel_parallel) <= bank_depth | |
出力サイズ | output_channel <= 256 * channel_parallel | |
アクティベーション | ReLU、LeakyReLU、ReLU6、Hard-Swish、Hard-Sigmoid | |
Dilation | dilation * input_channel <= 256 * channel_parallell | |
depthwise-conv2d 1 | カーネル サイズ | W, H: [1, 8] |
ストライド | W, H: [1, 4] | |
Pad_left/Pad_right | [0, (kernel_w - 1) * dilation_w + 1] | |
Pad_top/Pad_bottom | [0, (kernel_h - 1) * dilation_h + 1] | |
In Size | kernel_w * kernel_h * ceil(input_channel / channel_parallel) <= bank_depth | |
Out Size | output_channel <= 256 * channel_parallel | |
アクティベーション | ReLU、ReLU6 | |
Dilation | dilation * input_channel <= 256 * channel_parallell | |
transposed-conv2d | カーネル サイズ | kernel_w/stride_w、kernel_h/stride_h: [1, 16] |
Strides | ||
Pad_left/Pad_right | [1, kernel_w-1] | |
Pad_top/Pad_bottom | [1, kernel_h-1] | |
Out Size | output_channel <= 256 * channel_parallel | |
アクティベーション | ReLU、LeakyReLU、ReLU6、Hard-Swish、Hard-Sigmoid | |
depthwise-transposed-conv2d 1 | カーネル サイズ | kernel_w/stride_w、kernel_h/stride_h: [1, 8] |
Strides | ||
Pad_left/Pad_right | [1, kernel_w-1] | |
Pad_top/Pad_bottom | [1, kernel_h-1] | |
Out Size | output_channel <= 256 * channel_parallel | |
アクティベーション | ReLU、ReLU6 | |
max-pooling/ average-pooling (PL 内の MISC ユニット) |
カーネル サイズ |
2/4/6pe: W,H: [1, 8] W==H 8pe_normal: W,H:{1,2,3,7} W==H |
ストライド | W: [1, 8] H: [1, 8] | |
Pad_left/Pad_right | [1, kernel_w-1] | |
Pad_top/Pad_bottom | [1, kernel_h-1] | |
アクティベーション | サポートしない | |
elementwise-sum (PL 内の MISC ユニット) |
入力チャネル | input_channel <= 256 * channel_parallel |
アクティベーション | ReLU | |
max-pooling/ average-pooling (AI エンジン 上の MISC ユニット) |
カーネル サイズ | 2/4/6/8pe: W,H: [1, 128] |
ストライド | W: [1, 128] H: [1, 128] | |
Pad_left/Pad_right | [1, kernel_w-1] | |
Pad_top/Pad_bottom | [1, kernel_h-1] | |
アクティベーション | サポートしない | |
elementwise-sum (AI エンジン 上の MISC ユニット) |
入力チャネル | input_channel <= 128 * channel_parallel |
アクティベーション | ReLU、Hard-Sigmoid | |
elementwise-multi (AI エンジン 上の MISC ユニット) |
入力チャネル | input_channel <= 128 * channel_parallel |
アクティベーション | ReLU、Hard-Sigmoid | |
各種構成は次のとおりです。
|