機能概要 - 3.1 日本語

UltraScale Architecture Soft Error Mitigation Controller v3.1 LogiCORE IP 製品ガイド (PG187)

Document ID
PG187
Release Date
2019-05-22
Version
3.1 日本語

SEM Controller は、デザインの要件に応じて 6 種類のモードのいずれかで生成できます。

軽減 + テスト (Mitigation and Testing) モード

軽減 (Mitigation only) モード

検出 + テスト (Detect and Testing) モード

検出 (Detect only) モード

エミュレーション (Emulation) モード

モニター (Monitoring) モード

軽減 (+ テスト) モードではエラー検出、エラー訂正、およびオプションでエラー分類が可能です。軽減モードではエラー挿入はできません。

検出 (+ テスト) モードではエラー検出が可能で、エラーの訂正と分類はできません。検出モードではエラー挿入はできません。

残りの 2 つのモード (エミュレーション モードとモニター モード) では、シングル イベント アップセット (SEU) イベントが発生した場合のシステム動作を評価および観察できます。これらのモードには、エラー検出、エラー訂正、およびエラー分類の機能はありません。モニター モードではエラーは挿入できません。

いずれのモードでも、SEM Controller はまず初期化を実行します。この初期化により、FPGA がユーザー モードになった後、FPGA 内蔵のソフト エラー検出機能が既知のステートに移行します。この初期化後の SEM Controller の動作は、選択したモードによって異なります。軽減 (+ テスト) モードおよび検出 (+ テスト) モードの場合、SEM Controller は内蔵のソフト エラー検出ステータスを監視します。エミュレーションおよびモニター モードの場合はアイドル ステートに移行し、コマンドまたはモニター インターフェイスからのコマンド入力を待ちます。

軽減 (+ テスト) モードで ECC または CRC エラーを検出すると、SEM Controller は状況を評価してエラーの発生したコンフィギュレーション メモリ位置を特定します。

メモリ位置を特定できた場合、SEM Controller はソフト エラーを訂正します。 訂正にはアクティブ パーシャル リコンフィギュレーションを使用し、Read-Modify-Write によってコンフィギュレーション メモリを部分的に訂正します。 この方法は、アルゴリズムを使用して訂正の必要なエラーを特定します。

SEM Controller には、ルックアップ テーブルを使用してソフト エラーがエッセンシャルかそうでないかを分類するオプション機能があります。エラー分類の実行中、必要に応じて情報がフェッチされます。このデータもインプリメンテーション ツールによって提供され、SEM Controller の外部に格納されます。

ヒント: そのまま使用可能なソリューションでエラー分類機能を利用するには、外部 SPI フラッシュにエッセンシャル ビット データを格納する必要がありますが、分類機能は IP 外部に実装することもできます。この場合、エッセンシャル ビット データをシステム メモリに格納し、SEM Controller のモニター/UART インターフェイスで報告されるエラー位置に基づいてルックアップを実行してください。

検出 (+ テスト) モードで ECC または CRC エラーを検出すると、SEM Controller は状況を評価してエラーの発生したコンフィギュレーション メモリ位置を特定し、可能であればそのメモリ位置を報告します。エラー検出レポートの出力が終わると、SEM Controller はアイドル ステートに遷移します。

軽減 + テスト、検出 + テスト、およびエミュレーション モードでは、SEM Controller がアイドル ステートの場合にユーザーがコマンドを入力してコンフィギュレーション メモリにエラーを挿入できます。軽減 + テスト モードおよび検出 + テスト モードでこの機能を使用すると、より大規模なシステム デザインに統合した SEM Controller をテストするのに役立ちます。

エミュレーション モードでこの機能を使用すると、システム デザインに対する SEU イベントの影響を評価するのに役立ちます。 システム検証/バリデーション エンジニアはエラー挿入機能を使用してテスト ケースを構築し、システム全体がソフト エラー イベントに想定どおりの応答を示すかどうかを確認できます。

エラー挿入以外にも、アイドル ステートではフレーム読み出し、コンフィギュレーション レジスタ読み出し、外部メモリ読み出し、フレーム アドレス変換などテストやデバッグに役立つ機能を実行できます。

これ以外に、検出スキャンと診断スキャンという 2 種類のエラー検出機能があります。 これらのコマンドは、どのモードでもアイドル ステート時に SEM Controller に発行できます。

検出スキャン – このコマンドを実行すると SEM Controller は ECC または CRC エラーを検出するまでコンフィギュレーション メモリのスキャンを継続します。 エラーを検出すると、SEM Controller はエラー レポートを出力してアイドル ステートに移行します。 軽減 (+ テスト) モードとは異なり、この機能にはエラー訂正は含まれません。

診断スキャン – このコマンドを実行すると SEM Controller はコンフィギュレーション メモリを 1 回スキャンして、検出されたすべての ECC エラーを報告します。1 回のスキャンが完了すると、SEM Controller はアイドル ステートに戻ります。この機能で使用するエラー検出メカニズムは、デバイス内蔵のエラー検出機能を使用しません。このタイプのスキャンでは、エラー訂正は実行されません。

ほとんどの場合、SEM Controller は軽減 + テスト モードでデフォルトのコンフィギュレーションのまま使用します。この場合、SEU イベントの検出と訂正に加え、エラー挿入機能も利用でき、アイドル ステートでその他の便利な機能をすべて利用できます。量産段階で軽減モードに変更して、エラー挿入機能を無効にすることもできます。

その他のモードおよび機能は、ユーザー制御によるものなど高度な SEU 軽減ソリューションを必要とするシステム向けに用意されています。

ユーザー制御による軽減ソリューションを必要とする軽減ストラテジの一例として、訂正は行わずエラー ログのみを記録するというものがあります。このような軽減ストラテジは、SEM Controller を検出モードでコンフィギュレーションして実装できます。

たとえば SEM Controller を検出モードでコンフィギュレーションして使用すると、コントローラーは初期化完了後すぐに検出スキャンを自動で実行します。エラーが検出された場合、そのエラーに対してユーザーはデバイスのリコンフィギュレーションやロジックのリセットなど任意の措置をとることができます。

最初のエラーまたは最初の訂正不能エラーが検出された時点でデバイスに対する診断スキャンを周期的に実行し、デバイスに累積したすべての ECC エラーのログを記録します。ログに記録された検出済みフレーム レベル ECC エラーを使用して、後でオフライン ポストプロセスを実行できます。

重要: 診断スキャン機能は軽減用には設計されていないため、リアルタイムの軽減には使用しないでください。コンフィギュレーション メモリでエラーが発生したまま動作させた場合、ザイリンクスは FPGA の機能を保証しません。 この機能は検出モードや軽減モードに比べエラー検出レイテンシがはるかに大きいため、診断目的の使用にとどめてください。