インテル® VTune™ Amplifier 2018 ヘルプ

ホットスポット・ビューポイント

インテル® VTune™ Amplifier のホットスポット・ビューポイントを使用して、最も CPU 時間を必要とするプログラムユニット (ホットスポット) を特定します。このビューポイントは、すべての解析結果で利用できます。

ホットスポット・ビューポイントで示されるパフォーマンス・データを解釈するには、次のステップに従います。

  1. パフォーマンス・ベースラインを定義します。

  2. 最も時間を費やしている関数を特定します。

  3. アルゴリズムの問題を特定します。

  4. ソースを解析します。

  5. その他の解析タイプを試してみます。

パフォーマンス・ベースラインを定義

最初に、[Summary (サマリー)] ウィンドウでアプリケーションの実行に関する全般的な情報を確認します。経過時間 (アプリケーションの開始から終了までの実行時間) は、アプリケーション CPU 時間 (アプリケーションで実行されたすべてのスレッドの CPU 時間の合計で、待機時間は除く) とは異なります。

最適化前後の比較のベースラインとして、[Summary] ウィンドウの経過時間を使用します。アプリケーションのチューニングでスレッドを追加すると、経過時間が減り、CPU 時間が増えることがある点に注意してください。

最も時間を費やしている関数を特定

基本的なパフォーマンス・データは、[Bottom-up (ボトムアップ)][Top-down Tree (トップダウン・ツリー)] ペインで確認できます。このデータを使用して最も時間を費やしている関数を特定します。

デフォルトでは、[Bottom-up] ペインのデータは降順にソートされ、最も時間のかかっている関数が最初に表示されます。CPU 時間が最も長い関数に注目します。これが最適化の候補となります。

CPU 時間がどれくらい効率良く使用されたか詳細を得るには、ユーザーモード・サンプリングとトレース収集[Hotspots by CPU Usage (CPU 使用率別ホットスポット)] ビューポイントに切り替えて、[CPU Time (CPU 時間)] 列を展開します。

CPU 使用率別ホットスポット・ビューポイント: [Bottom-up] ペイン

ハードウェア・イベントベース・サンプリングの結果を得るため、異なるビューポイントに切り替える必要はありません。CPU 使用率 データは、 をクリックして [Effective Time by Utilization (使用率別有効時間)] 列を拡張すると表示されます。

Poor (低) の値が最も大きなプログラムユニットをチューニングします。このプログラムユニットでは、実行時に CPU 時間が最大限に使用されていません。CPU 使用率が Poor (低) および Over (高) のものを短くし、Ideal (理想) (緑 ) または OK (許容範囲) (オレンジ ) になるように最適化します。

アルゴリズムの問題を特定

アプリケーションの呼び出しシーケンスの問題を特定し、関数の呼び出し方法を変更することでパフォーマンスを改善できます。潜在的な問題の場所を特定するには次の方法があります。

ソースを解析

最も時間を費やしている関数をダブルクリックして、[Source(ソース)]/[Assembly (アセンブリー)] ウィンドウでコードを表示します。インテル® VTune™ Amplifier から直接コードエディターを開き、シリアルコードを編集 (ホットスポット関数への呼び出し回数を最小限にするなど) できます。

その他の解析タイプを試してみる

関連情報