ザイリンクス DPUCVDX8H DPU は、主に高性能アプリケーション向けのたたみ込みニューラル ネットワークに最適化されたプログラマブル エンジンです。イメージ分類、物体検出、セマンティック セグメンテーションなどの深層学習の推論タスクに使用できます。これは Versal® プラットフォーム向けに設計されています。次の図に、Versal プラットフォームのアーキテクチャを示します。Versal ACAP はより強力な Arm® コアを統合するほか、さらに重要な点として、AI エンジンと呼ばれる新しい強力なプログラマブル演算アレイを統合しています。大規模 DSP アレイとして使用して 5G などの一般的な高密度コンピューティング タスクを高速化できます。AI エンジンは機械学習タスクにも最適化されています。プログラマブル ロジックと比較すると、ほとんどのコンピューティング タスクで AI エンジン の方がはるかに優れた性能が得られます。DPUCVDX8H では、制御ロジックと少量の計算のみを PL に残し、計算タスクの大部分を AI エンジン で実行します。
このユニットには、高性能スケジューラ モジュール、ハイブリッド コンピューティング アレイ モジュール、命令フェッチ ユニット モジュール、制御およびメモリ アクセス モジュール、メモリ プール モジュールがあります。DPU は、多くのたたみ込みニューラル ネットワークで効率的なマッピングをサポートすることに特化した命令セットを使用します。運用されているたたみ込みニューラル ネットワークには、VGG、ResNet、GoogLeNet、YOLO、SSD、FPN があります。
DPU IP のたたみ込みコンピューティング ユニットは AI エンジンに実装されており、制御およびメモリ アクセス ユニットとメモリ プールはプログラマブル ロジックに実装されています。DPU IP は標準的な AXI インターフェイスで NoC に接続し、DRAM へのアクセス、外部制御コマンドの受信が可能です。DPU は ザイリンクス シェルまたは自己定義ロジックを使用して操作し、コンフィギュレーション/ネットワーク命令の挿入/割り込みの処理、データ移動などを実行できます。開発を簡略化し、使いやすさを向上するため、ザイリンクスでは設計への組み込みに役立つプラットフォーム、シェル、関連ツールを提供しています。
次の図に、DPU の最上位ブロック図を示します。