DPUCZDX8G のアーキテクチャ - 4.0 日本語

Zynq UltraScale+ MPSoC 向け DPUCZDX8G 製品ガイド (PG338)

Document ID
PG338
Release Date
2022-06-24
Version
4.0 日本語

DPUCZDX8G IP は、たたみ込みアーキテクチャを選択できます。このアーキテクチャは、たたみ込みユニットの並列度に関係します。DPUCZDX8G IP のアーキテクチャには、B512、B800、B1024、B1152、B1600、B2304、B3136、および B4096 があります。

DPUCZDX8G のたたみ込みアーキテクチャには、ピクセル並列度、入力チャネル並列度、出力チャネル並列度の 3 つの次元の並列度があります。入力チャネル並列度は、常に出力チャネル並列度と同じになります (表 8 の channel_parallel と同じ)。

図 1. 並列化を 3 次元で可視化

図 10 では、入力チャネル並列度 (ICP) = 3、出力チャネル並列度 (OCP) = 3、ピクセル並列度 (PP) = 2 としています。OCP は、たたみ込み演算で使用するカーネル数に相当します。図中のピクセルは、わかりやすくするために任意で使用しています。
注記: 計算に使用されるエレメントは、各チャンネルから 1 ピクセルずつ使用します (図中の赤い立方体)。ICP = OCP = 3、PP = 2 の場合、1 サイクルあたりのたたみ込み MAC 数は 3 * 3 * 2 = 18 となります。

必要なプログラマブル ロジック リソースは、アーキテクチャによって異なります。大規模なアーキテクチャの方が性能は高くなりますが、使用するリソース量も多くなります。次の表に、各アーキテクチャの並列度を示します。

表 1. 各たたみ込みアーキテクチャの並列度
DPUCZDX8G アーキテクチャ ピクセル並列度 (PP) 入力チャネル並列度 (ICP) 出力チャネル並列度 (OCP) ピーク OPS (1 サイクルあたりの演算実行回数)
B512 4 8 8 512
B800 4 10 10 800
B1024 8 8 8 1024
B1152 4 12 12 1150
B1600 8 10 10 1600
B2304 8 12 12 2304
B3136 8 14 14 3136
B4096 8 16 16 4096
  1. たたみ込みアレイは、1 クロック サイクルで乗算と累算を実行します。これらは 2 つの演算としてカウントされます。したがって、ピーク OPS = PP*ICP*OCP*2 です。