専用ブロックおよびマクロプリミティブを含むパスを最適化

専用ブロックおよびマクロプリミティブを含むパスを最適化 - 2023.2 日本語

Versal アダプティブ SoC システム統合および検証設計手法ガイド (UG1388)

Document ID

UG1388

Release Date

2023-11-15

Version

2023.2 日本語

専用ブロックおよびマクロプリミティブ (DSP、ブロック RAM、UltraRAM、NoC マスターユニット/スレーブユニット (NMU/NSU)、AI エンジン、および XPIO など) で開始または終了するパス、あるいはその間のパスは、これらのプリミティブには次のようなタイミング特性があるので、特別な注意が必要です。

一部のピンでセットアップ/ホールド/clock-to-output タイミングアークの値が大きい。たとえばブロック RAM の clock-to-output 遅延は、オプションの出力レジスタなしで 1.2 ns、オプションの出力レジスタありで 0.3 ns です。詳細は、ターゲットデバイスシリーズのデータシートを参照してください。
NoC 出力ピンで clock-to-output タイミングアークの値が大きい。たとえば、NoC NSU の clock-to-output 遅延は約 0.65 ns です。
通常の FD/LUT 接続よりも配線遅延が大きい。
通常の FD-FD パスよりもクロックスキューの変動が大きい。
ファブリックとデバイスの上辺/下辺にある専用ブロック (AI エンジン、XPHY ロジック、I/O ロジック、およびクロック調整ブロックなどの XPIO 内にある専用ブロックなど) の間の配線遅延が大きい。

また、これらのプリミティブの使用可能性とサイトロケーションも CLB スライスより制限されるので、その配置はより困難であり、QoR 低下の原因となることがよくあります。

これらの理由から、AMDでは次を推奨します。

専用ブロックおよびマクロプリミティブで開始または終了するパスをできるだけパイプライン処理します。
これらのセルに接続されている組み合わせロジックの構造を変更し、ロジック段数を最低でも 1 セル、またはパイプライン処理により追加されるレイテンシが懸念される場合は 2 セル削減します。
配置前にこれらのパスのセットアップタイミングが最低でも 500 ps で満たされるようにします。
専用ブロックまたはマクロプリミティブを遠くに配置する必要がある場合は、それら多数に接続されているロジックコーンを複製します。
デザインに含まれる DSP ブロックに入出力されるパスまたは DSP ブロック内のタイミング要件が厳しい場合は、opt_design -dsp_register_opt を実行してレジスタをタイミングがより適切になる位置に移動します。
注記: opt_design の段階ではタイミングは見積もりであるため、phys_opt_design -dsp_register_opt を実行して、配置前にはタイミングが正確でなかった部分の移動を修正する必要がある場合もあります。
AI エンジンと XPIO 内の専用ブロック (XPHY ロジック、I/O ロジック、クロック調整ブロックなど) とのインターフェイスとなるパイプラインフリップフロップの配置に境界ロジックインターフェイス (BLI) を使用します。一部の IP には、BLI フリップフロップを使用するオプションがあります。