割り込みとエラー処理

Versal ACAP CPM CCIX アーキテクチャ マニュアル (AM016)

Document ID
AM016
Release Date
2020-11-24
Revision
1.1 日本語

CMN のコンポーネントによって検出されるエラーは、次の表に示すように主に 3 つのカテゴリに分類されます。

表 1. 割り込みとエラー処理
エラーの種類 説明 ハードウェアによるアクション
訂正可能エラー ECC またはその他の方法で訂正が可能なエラー。
  • いずれかの RAM の 1 ビット ECC エラー。
  • ローカル リトライによって回復されるエラー。

1.エラー ログを記録します。

2.エラーの発生回数をカウントします。

3.エラーをグローバル RAS ブロックに通知します (しきい値カウントによる制御が可能)。

先送りされたエラー CMN のあるノードで訂正不能なエラーが検出されたが、同じノード内でそのデータを使用せず、データに対してポイズン ビットをセットした場合。このようなエラーの場合、システムは通常しばらくの間データの破損なしに動作できます。 サポートされないオペコードを含む要求パケットを受信した場合。

1.データ エラーまたは非データ エラーの RespErr 値を持った応答を送信します。

2.エラー ログを記録します。

3.エラーを CMN 内のグローバル RAS ブロックに通知します。

訂正不能な致命的エラー あるノードの制御ロジックでエラーが発生し、そのまま動作を継続するとシステムが破損し、回復不能になる場合。
  • スヌープ フィルターから読み出したデータの 2 ビット ECC エラー。
  • ターゲット ID にエラーを含むパケットを受信した場合。
  • 内部ロジック エラー。

1.エラー ログを記録します。

2.エラーをグローバル RAS ブロックに通知します。

グローバル RAS (信頼性、可用性、保守性) ブロックはエラー割り込みを生成し、CCIX ファームウェアがその割り込みを処理します。ファームウェアは、PER (Protocol Error Reporting) メッセージ パケットを適宜生成します。PER 生成の詳細は、CCIX 対応 PCIe コントローラー を参照してください。