ビューポイントの切り替え

ビューポイント (インテル® VTune™ プロファイラーの事前設定されたデータビュー) を使用して、特定のパフォーマンスの問題に注目します。

デフォルトでは、インテル® VTune™ プロファイラーはビューポイントを表示しないか、特定の解析タイプで有効な可能性があるビューポイントの管理選択画面を表示します。メニューの [オプション] で、[該当するすべてのビューポイントの表示] を有効にすると該当するすべてのビューポイントの表示を有効にできます。

ビューポイントを選択する場合、インテル® VTune™ プロファイラーが結果タブのウィンドウに表示するパフォーマンス・メトリックを選択します。ビューポイントを選択するには、下矢印をクリックします。

インテル® VTune™ プロファイラーのビューポイント

実行した解析タイプ名。

現在のビューポイント名。ビューポイント名の横にある下矢印をクリックすると、利用可能なビューポイントを含むドロップダウン・メニューが開きます。

現在のビューポイントの状況依存ヘルプアイコン。

現在の解析タイプで利用可能なビューポイントのリストを表示するドロップダウン・メニュー。

次の表は、それぞれの解析タイプで使用できるビューポイントを示します。

ビューポイント

説明

CPU 利用率によるホットスポット

多くの CPU 時間を消費しているアプリケーションのコード領域であるホットスポットの特定を支援します。CPU 時間は、CPU 利用率状態を示す、アイドル、低い、OK、理想的に分類されます。

スレッド化効率

マルチスレッド・アプリケーションが利用可能な CPU コアをどのように活用しているかを示し、非効率な利用率の原因を特定するのに役立ちます。このビューを使用して、同期オブジェクト (ロック) の待機時間が長すぎるスレッドを特定したり、スケジュールのオーバーヘッドを識別します。

マイクロアーキテクチャー全般

アプリケーションが、利用可能なハードウェア・リソースを最大限に活用していない場所を特定するのに役立ちます。このビューポイントでは、ハードウェア・イベントから派生したメトリックが表示されます。[サマリー] ウィンドウには、実行全体のメトリックのレポートとともに、メトリックの概要説明が示されます。[ボトムアップ][トップダウン・ツリー] ウィンドウから、アプリケーションのハードウェアの問題を検出できます。パフォーマンスを向上する潜在的な可能性が見つかると、セルがハイライト表示されます。問題の説明を見るには、グリッドでハイライト表示されたメトリックにカーソルを移動します。

ハードウェア・イベント

監視されたハードウェア・イベントの統計を表示します。統計には、予測されたカウントや収集されたサンプル数、あるいはその両方が含まれます。このビューを使用して、注目するイベントに対し最も高いアクティビティーを持つコード領域 (モジュール、関数、コード行など) を特定します。

メモリー使用

アプリケーションがメモリーをどの程度効率的に使用しているかを理解し、NUMA プラットフォーム上でのリモートメモリーへの過度なアクセスの問題 (DRAM やインターコネクト帯域幅制限など) の可能性を特定します。アプリケーション・コードとメモリー・オブジェクト配列の両方に対して、各種パフォーマンス・メトリックを提供します。

HPC パフォーマンス特性

アプリケーションが CPU、メモリー、および浮動小数点操作リソースをどの程度効率的に使用しているか評価するのに役立ちます。このビューを使用して、インテルの OpenMP* と MPI ランタイムのスケーラビリティーの問題を改善したり、メモリーと FPU 効率を向上させる次のステップを特定できます。

入力と出力

ターゲットの実行に関連する入出力データ、CPU とバスの利用率統計を表示します。このビューを使用して、長いレイテンシーの I/O 要求を特定したり、I/O 関数のコールスタックを調査したり、タイムライン上で低速な I/O 要求を解析したり、I/O と計算操作のインバランスを検出できます。

GPU 計算/メディア・ホットスポット

髙い GPU 利用率の GPU タスクを特定し、効率を予測するのに役立ちます。これは、SYCL* 計算タスク、OpenCL* カーネルの解析およびインテル® メディア SDK タスクの解析に役立ちます。このビューを使用して、最も時間がかかる GPU 計算タスクを特定したり、時間経過における GPU タスクの実行を解析したり、GPU アーキテクチャー・ブロックごとの GPU ハードウェア・メトリックを調査できます。

FPGA ホットスポット

高い利用率の FPGA と CPU タスクを特定します。このビューを使用して、カーネルの実行に費やされた FPGA 時間、CPU と FPGA 間のメモリー転送の合計時間、および CPU と FPGA 間のワークロードのバランスを評価します。

GPU レンダリング

Xen* 仮想化プラットフォーム固有のサポートを含む、GPU レンダリング解析 (プレビュー) で収集されたプラットフォーム全体の CPU/GPU 利用率と効率統計を示します。

プラットフォーム電力解析

非効率な電力利用につながるアプリケーションのアイドルまたはウェイクアップの場所を特定するのに役立ちます。可能であれば、ハードウェア示す実際の状態と比較したディープスリープ状態における OS 要求時間を示す詳細な C ステート常駐レポートなど、OS とハードウェア両方の視点からのデータを提供します。

関連情報