インテル® VTune™ プロファイラーを使用して、アプリケーションの呼び出しツリーのループ階層を表示し、最適化するコード領域を特定します。
アプリケーションのループを表示して解析するには次の操作を行います。
- ハードウェア・イベントベース収集を基にカスタム解析 (例えば、ループ解析) を作成し、[ループ解析]、[呼び出し数の予測]、および [トリップカウントの予測] オプションを選択します。
- フィルターツールバーの [ループモード] ドロップダウン・メニューから、フィルターレベルを選択します。
ループのみ: ループを通常のノードとしてツリーに表示します。ループ名には次のものが含まれます。
ループの開始アドレス
ループが作成されたコード行番号
ループが作成された関数名
ループと関数: ループと関数を個別のノードとして表示します。
関数のみ (デフォルト): ループ情報を含まない関数データを表示します 。
インテル® VTune™ プロファイラーは、選択したフィルターレベルに応じてグリッドを更新します。
- [ボトムアップ] および [トップダウン・ツリー] ウィンドウで、セルフと合計メトリックを解析し、最も時間を消費しているループを特定します。
- 注目するループをダブルクリックして、ソースコードを表示します。
インテル® VTune™ プロファイラーは、選択したループと関数のソースファイルを開きます。ループを構成するコード行がハイライト表示されます。
注
コード行の情報は、関数のデバッグ情報が利用可能な場合にのみ表示されます。
例
最も時間を消費するループを特定するには、[ボトムアップ] ウィンドウで [ループのみ] モードを選択します。デフォルトでは、最も高い CPU 時間値を持つループがグリッドの上位に表示されます。
最も重い上位レベルのループを特定するには、[トップダウン・ツリー] ウィンドウに切り替えます。グリッド内のデータは、最も時間がかかる最上位のループから合計時間のメトリックでソートされます。