インテル® VTune™ Amplifier 2018 ヘルプ
インテル® VTune™ Amplifier のホットスポット・ビューポイントを使用して、最も CPU 時間を必要とするプログラムユニット (ホットスポット) を特定します。このビューポイントは、すべての解析結果で利用できます。
ホットスポット・ビューポイントで示されるパフォーマンス・データを解釈するには、次のステップに従います。
最初に、[Summary (サマリー)] ウィンドウでアプリケーションの実行に関する全般的な情報を確認します。経過時間 (アプリケーションの開始から終了までの実行時間) は、アプリケーション CPU 時間 (アプリケーションで実行されたすべてのスレッドの CPU 時間の合計で、待機時間は除く) とは異なります。
最適化前後の比較のベースラインとして、[Summary] ウィンドウの経過時間を使用します。アプリケーションのチューニングでスレッドを追加すると、経過時間が減り、CPU 時間が増えることがある点に注意してください。
基本的なパフォーマンス・データは、[Bottom-up (ボトムアップ)] と [Top-down Tree (トップダウン・ツリー)] ペインで確認できます。このデータを使用して最も時間を費やしている関数を特定します。
デフォルトでは、[Bottom-up] ペインのデータは降順にソートされ、最も時間のかかっている関数が最初に表示されます。CPU 時間が最も長い関数に注目します。これが最適化の候補となります。
CPU 時間がどれくらい効率良く使用されたか詳細を得るには、ユーザーモード・サンプリングとトレース収集の [Hotspots by CPU Usage (CPU 使用率別ホットスポット)] ビューポイントに切り替えて、[CPU Time (CPU 時間)] 列を展開します。
ハードウェア・イベントベース・サンプリングの結果を得るため、異なるビューポイントに切り替える必要はありません。CPU 使用率 データは、 をクリックして [Effective Time by Utilization (使用率別有効時間)] 列を拡張すると表示されます。
Poor (低) の値が最も大きなプログラムユニットをチューニングします。このプログラムユニットでは、実行時に CPU 時間が最大限に使用されていません。CPU 使用率が Poor (低) および Over (高) のものを短くし、Ideal (理想) (緑 ) または OK (許容範囲) (オレンジ ) になるように最適化します。
アプリケーションの呼び出しシーケンスの問題を特定し、関数の呼び出し方法を変更することでパフォーマンスを改善できます。潜在的な問題の場所を特定するには次の方法があります。
[Top-down Tree] ペイン: ホットスポットの呼び出し元と呼び出し先の合計時間とセルフ時間を検証して、それぞれの時間を最適化できるかどうか確認します。
[Call Stack (コールスタック)] ペイン: [Bottom-up] または [Top-down Tree] ペインで選択したプログラムユニットのスタックのうち最も割合の高いものが表示されます。ナビゲーション・ボタン を使用して、選択したプログラムユニットを呼び出したスタックの表示を切り替えることができます。バーは、選択したプログラムユニットで費やされた合計時間に対する現在表示されているスタックの割合を示しています。[Call Stack] ペインのドロップダウン・リストを使用して、異なるスタックのデータを表示することもできます。
最も時間を費やしている関数をダブルクリックして、[Source(ソース)]/[Assembly (アセンブリー)] ウィンドウでコードを表示します。インテル® VTune™ Amplifier から直接コードエディターを開き、シリアルコードを編集 (ホットスポット関数への呼び出し回数を最小限にするなど) できます。