カスケード ストールの解析 - 2023.2 日本語

AI エンジン ツールおよびフロー ユーザー ガイド (UG1076)

Document ID
UG1076
Release Date
2023-12-04
Version
2023.2 日本語
パフォーマンス メトリクス解析から、解析が必要なカスケード ストールを特定できます。
  1. Trace ビューを選択します。
  2. Cascade Stalls ビューを選択します。
  3. Cascade stall をクリックします。
  4. Cascade stall は、Trace ビューでハイライトされます。
    図 1. Trace ビューのカスケード ストール

    各カスケード ストールには、次の情報が含まれます。

    NAME
    ストリーム ストールには、CS_<NUM> という名前が付けられます。発生した順番に番号が付けられます。番号は、ストールのすべてのタイプの間で固有です。
    Stalled Tile
    ストールしたカーネルが存在する AI エンジン タイル。
    Stalled Kernel
    ストールしたカーネル。<Kernel_function_name>.<Schedule_ID>.<Graph_instance_name> という名前です。_main と表示されることもあり、その場合はクロスプローブして実際のカーネル関数を見つける必要があります。
    Start (ps)
    ストールの開始時間。
    Duration (ps)
    ストール時間の長さ。
    PC
    ストールが発生したときのプログラム カウンター。
    Stalled Port
    ストールしたカーネルのストールしているポート。
    Related Stalls
    ストールを発生させる可能性のあるほかのストール。
    Full Destination
    フルであるためにストールしたカーネルで書き込むことができなかったポート。
    Empty Source
    空であるためにストールしたカーネルで読み出すことができなかったポート。

    Trace ビューでカスケード ストールを調べ、それらがどのように関連しているかを確認します。

  5. ほかのタイプのストールがカスケード ストールを発生させている可能性があります。ほかのタイプのストールを調べて、何が起こったのかを解析します。Stalls ビューの [Related Stalls] は、カスケード ストールを発生させたストールを示します。
  6. Graph ビューでストールを表示すると、ストールの原因を特定するのに役立ちます。Graph view を選択します。
  7. Cascade Stalls ビューを選択します。
  8. Stalls ビューでパスをクリックすると、そのストール パスが Graph ビューに赤で表示されます。
  9. カスケード ストールおよび関連のストールを調べると、ストールの原因を特定するのに役立ちます。Related Stalls をクリックすると、関連のストールも赤で表示されます。たとえば、Related Stalls の SS_16 をクリックすると、パスが赤で表示され、ストールの開始位置がわかります。
    図 2. Graph ビューのカスケード ストール

次の表に、カスケード ストールが発生する状況と可能なソリューションを示します。

表 1. カスケード ストールが発生する状況とソリューション
ソース デスティネーション ストール タイプ 可能なソリューション
カスケード ストリーム カスケード ストリーム カスケード ストール
  • カーネル実行サイクルのカスケード ストリームの読み出し/書き込み命令を調整し、ソースとデスティネーションのカーネルを一致させます。
  • カスケード ストールを発生させているほかのソースを解析します。
ストリーム + カスケード ストリーム ストリーム + カスケード ストリーム カスケード ストール
  • 異なるストリーム間が一致するよう命令を調整します。
  • カスケード ストールを発生させているほかのソースを解析します。