DPUCVDX8G は、Versal ACAP デバイス向けに最適化された高性能な汎用たたみ込みニューラル ネットワーク (CNN) プロセッシング エンジンです。この IP はユーザーが構成できるようにパラメーター指定が可能なため、使用する AI エンジンの数や PL リソースの使用率を最適化できます。DPUCVDX8G は、AI エンジンと PL 両方で構成されています。
DPUCVDX8G の AI エンジンは、たたみ込みを実行します。AI エンジン インターフェイス タイルによって、AI エンジンと PL 間でデータが転送されます。一部の Versal デバイスでは、高性能演算を実行するために、隣接する複数の AI エンジンを含む AI エンジン グループを使用します。複数バッチを含む DPUCVDX8G アーキテクチャでは、各バッチ ハンドラーに非公開の AI エンジン グループがあります。
PL コンポーネントには、高レベルのスケジューラ モジュール、共有重み用のグローバル メモリ、および Load、Save、Depth-Wise、Pool、Elt-wise のバッチ ハンドラーが含まれています。スケジューラと重みバッファーは、すべての DPUCVDX8G のバッチ ハンドラー間で共有されるロジックです。Load、Save モジュール、Depth-Wise、Pooling、Elt-wise モジュール、およびローカル特徴マップ ストレージは、各バッチ ハンドラーで非公開です。
図 1 に、DPUCVDX8G の最上位ブロック図を示します。
図 1.
DPUCVDX8G のブロック図