CMN のコンポーネントによって検出されるエラーは、次の表に示すように主に 3 つのカテゴリに分類されます。
エラーの種類 | 説明 | 例 | ハードウェアによるアクション |
---|---|---|---|
訂正可能エラー | ECC またはその他の方法で訂正が可能なエラー。 |
|
1.エラー ログを記録します。 2.エラーの発生回数をカウントします。 3.エラーをグローバル RAS ブロックに通知します (しきい値カウントによる制御が可能)。 |
先送りされたエラー | CMN のあるノードで訂正不能なエラーが検出されたが、同じノード内でそのデータを使用せず、データに対してポイズン ビットをセットした場合。このようなエラーの場合、システムは通常しばらくの間データの破損なしに動作できます。 | サポートされないオペコードを含む要求パケットを受信した場合。 |
1.データ エラーまたは非データ エラーの RespErr 値を持った応答を送信します。 2.エラー ログを記録します。 3.エラーを CMN 内のグローバル RAS ブロックに通知します。 |
訂正不能な致命的エラー | あるノードの制御ロジックでエラーが発生し、そのまま動作を継続するとシステムが破損し、回復不能になる場合。 |
|
1.エラー ログを記録します。 2.エラーをグローバル RAS ブロックに通知します。 |
グローバル RAS (信頼性、可用性、保守性) ブロックはエラー割り込みを生成し、CCIX ファームウェアがその割り込みを処理します。ファームウェアは、PER (Protocol Error Reporting) メッセージ パケットを適宜生成します。PER 生成の詳細は、CCIX 対応 PCIe コントローラー を参照してください。