デザインの取り込みとモデリング

デザインの取り込みとモデリング - 2022.1 日本語

Vitis 統合ソフトウェアプラットフォームの資料: アプリケーションアクセラレーション開発 (UG1393)

Document ID

UG1393

Release Date

2022-05-25

Version

2022.1 日本語

前のセクションでは、VSC により統合 C++ モデルからコンパイルされた構成、ソフトウェアインターフェイス、およびハードウェアについて説明しました。次に、特定の設計意図を簡単に取り込むために使用できる、ソース C++ モデルの主な機能の概要を示します。

各アクセラレータとその CU グループとの間でデータを送受信できるように、2 つの C スレッドを使用したホストからデバイスへのデータ転送を明示的にモデリング
複数のメモリバンクの使用、CU の変更、ホストとデバイス間の同時 (ピンポン形式) データ転送などのガイダンスパラメーターを使用して、ホストコードやカーネルコードの変更を最小限に抑えながら、パフォーマンスを調査
単一の数値ガイダンスパラメーターのみを使用して粗粒度の並列処理を調査できるように、並列で実行される CU を複製
ラウンドロビンまたはフリーポーリングを使用して、計算クラスター (複数の CU) でジョブを自動スケジューリング
アクセラレータ内で複製された CU での自動データ転送およびアクセラレータジョブのスケジューリング
次を実行するための、 PCIe® を介した各アクセラレータジョブおよびその他の最適化の自動パイプライン
1. ホスト側の複数のバッファーオブジェクトを使用してデータを送受信
2. データ移動パターンのガイダンスに基づいて、CU ごとにデータムーバーがプラグイン
  1. グローバル (DDR/HBM) メモリリソースとオンチップ (RAM) メモリリソース間でデータをコピー
  2. 現在のトランザクションが CU で終了する前に、グローバルメモリから次のトランザクションをプリフェッチ
3. PCIe レイテンシを償却するため、トランザクション (1 つのデータブロックとして転送される n 個のデータセットのシーケンス) をクラスター化
4. CU ごとに複数のホストおよびデバイスメモリバッファーを使用した自動同時 (ピンポン形式) データ転送によりスループットを向上
5. ピークメモリ割り当て (最大データサイズに割り当て) を使用して、可変ペイロードサイズを許容。
6. 次の場合、ダイナミック出力バッファーサイズ (実行時に割り当て) をサポート
  1. 最大バッファーサイズは、コンパイル時に認識
  2. ダイナミックサイズは、アプリケーションコードにより決定
ソフトウェア (ホスト側) とハードウェア (計算ユニット) を組み合わせたシステムレベルの構成
1. 直接接続 (AXI4-Stream) インターフェイスを使用したハードウェアのみの構成。各 CU 内に PE パイプラインまたはネットワークを作成し、そのようなユニットを簡単に複製できます。
2. CU の同期パイプライン内でストリーミングインターフェイスを備えた、フリーランニング PE を許容
3. データ処理パイプラインを作成するためにハードウェアとソフトウェアを混在。ソフトウェアタスクでは、同じ xclbin にコンパイルされた異なるアクセラレータを使用して、ハードウェアタスク間でデータを処理できます。
システムデザイン全体が C++ で取り込まれ、それを C++ ソースのソフトウェアコンパイルおよび実行で検証可能