コアの概要 - 1.2 日本語

DPUCVDX8G は、Versal ACAP デバイス向けに最適化された高性能な汎用たたみ込みニューラルネットワーク (CNN) プロセッシングエンジンです。この IP はユーザーが構成できるようにパラメーター指定が可能なため、使用する AI エンジンの数や PL リソースの使用率を最適化できます。DPUCVDX8G は、AI エンジンと PL 両方で構成されています。

DPUCVDX8G の AI エンジンは、たたみ込みを実行します。AI エンジンインターフェイスタイルによって、AI エンジンと PL 間でデータが転送されます。一部の Versal デバイスでは、高性能演算を実行するために、隣接する複数の AI エンジンを含む AI エンジングループを使用します。複数バッチを含む DPUCVDX8G アーキテクチャでは、各バッチハンドラーに非公開の AI エンジングループがあります。

PL コンポーネントには、高レベルのスケジューラモジュール、共有重み用のグローバルメモリ、および Load、Save、Depth-Wise、Pool、Elt-wise のバッチハンドラーが含まれています。スケジューラと重みバッファーは、すべての DPUCVDX8G のバッチハンドラー間で共有されるロジックです。Load、Save モジュール、Depth-Wise、Pooling、Elt-wise モジュール、およびローカル特徴マップストレージは、各バッチハンドラーで非公開です。

図 1 に、DPUCVDX8G の最上位ブロック図を示します。

図 1. DPUCVDX8G のブロック図