インテル® VTune™ プロファイラーによるパフォーマンス解析の開始点として [サマリー] ウィンドウを使用します。このウィンドウにアクセスするには、[入力と出力] ビューポイントを選択して、結果タブで [サマリー] サブタブをクリックします。
解析ターゲットに応じて、[入力と出力] ビューポイントの [サマリー] ウィンドウは次のシステムレベルの統計を提供します。
[サマリー] ウィンドウにハイパーリンクとして表示されるメトリックやオブジェクト名をクリックすると、選択したメトリックでグリッドデータがソートされた状態、または選択したオブジェクトがハイライトされた状態で [ボトムアップ] ウィンドウが表示されます。デフォルトで、グリッドデータは [スレッド/ページフォールト] でグループ化されます。
[クリップボードへコピー] ボタンをクリックすると、選択したサマリーセクションの内容をクリップボードへコピーできます。
CPU メトリックのリストを調査して、アプリケーション実行全体のハイレベルの統計を把握します。
Linux* ターゲットでは、インテル® VTune™ プロファイラーはアプリケーションが I/O 依存であるか判断するのに役立つ [I/O 待機時間] メトリックを利用できます。
I/O 待機時間メトリックは、システムにアイドル状態のコアがある場合に、スレッドが I/O 待機状態である時間を示します。カウントされたスレッド数は、システムのアイドル状態のコア数を上回ることはありません。集約された I/O 待機時間メトリックは、[ボトムアップ] ビューの [タイムライン] ペインで利用可能な I/O 待機メトリックの整関数です。上記の例のように、I/O 待機時間がアプリケーション経過時間の大部分を占める場合、[プラットフォーム] ウィンドウに切り替えてタイムライン上のすべてのメトリックを詳しく調査して、I/O 待機の原因を理解します。
インテル® VTune™ プロファイラーはメトリックを解析し、インテル® アーキテクチャーが提供するしきい値と比較します。しきい値を上回ると、メトリック値にはパフォーマンスの問題としてフラグが追加されます。フラグ付きの値にマウスポインターを移動すると、問題の説明とチューニングの推奨が表示されます。
この分布図は、システム帯域幅が特定の値 (帯域幅ドメイン) で使用された時間を表し、帯域幅利用率を、高、中、低、に分類するしきい値を提供します。しきい値を変更するには、下部のスライドバーを使用します。
この分布図は、[メモリー帯域幅を解析] オプションを有効にして収集された結果で示されます。
全体の I/O パフォーマンス統計については、[SPDK 情報] セクションを参照してください。各デバイスが操作やメトリックごとでどのように実行されたか確認するには、対応するブロックを展開して SSD 間の潜在的な IO パフォーマンスのインバランスを特定します。
[SPDK スループット分布図] と表を調査して、選択した SPDK デバイスのスループットが低い ([低い] 利用率レベルの) 時間を特定します。
インテル® VTune™ プロファイラーは、最もパフォーマンス・クリティカルな関数と CPU 時間を [上位ホットスポット] に表示します。これらの関数を最適化することで、一般にアプリケーション全体のパフォーマンスが向上します。リストの関数をクリックすると、その関数の [ボトムアップ] ウィンドウが表示されます。
グレー表示された [その他] のモジュールがある場合、この表に含まれないアプリケーションのほかのすべての関数の合計値が示されます。
ビューポイント設定ファイルを介してこのリストのオブジェクト数と表示メトリックを制御できます。
[ディスク入出力分布図] は、カーネル・サブシステムによるストレージ要求の処理時間を示し、レイテンシー分布図の予測と低速の I/O 要求の識別に役立ちます。
X 軸はストレージ要求を満たすために要した時間を示し、Y 軸はこのカテゴリー内の入出力要求の数を示しています。[操作タイプ] ドロップダウン・メニューを使用して、注目する I/O 操作のタイプを選択します。例えば、I/O 操作の書込みタイプでは、I/O 操作タイプが合計 0.03 秒を超えて実行された 30 個のストレージ要求は、インテル® VTune™ プロファイラーによって低速として分類されます。
このタイプの I/O 要求の詳細を見るには、[ボトムアップ] ウィンドウで [タイムライン] ペインに切り替えます。
このセクションでは次のデータを提供します。
アプリケーションのコマンド行 |
ターゲット・アプリケーションへのパス。 |
オペレーティング・システム |
収集に使用されたオペレーティング・システム。 |
コンピューター名 |
収集に使用されたコンピューター名。 |
結果サイズ |
インテル® VTune™ プロファイラーで収集された結果のサイズ。 |
収集開始時間 |
外部収集の開始時間 (UTC 形式)。[タイムライン] ペインで、カスタムコレクターが提供するパフォーマンス統計を調査できます。 |
収集停止時間 |
外部収集の停止時間 (UTC 形式)。[タイムライン] ペインで、カスタムコレクターが提供するパフォーマンス統計を調査できます。 |
コレクタータイプ |
解析に使用されたデータコレクターのタイプ。次のタイプが利用できます。
|
CPU 情報 |
|
名前 |
収集に使用されたプロセッサー名。 |
周波数 |
収集に使用されたプロセッサーの周波数。 |
論理 CPU 数 |
収集に使用されたマシンの論理 CPU 数。 |
物理コア数 |
システム上の物理コア数。 |
ユーザー名 |
データ収集を開始したユーザー。このフィールドは、製品のインストール時にユーザーごとのイベントベース・サンプリング収集モードを有効にすると利用できます。 |
GPU 情報 |
|
名前 |
システムに搭載されているグラフィックス名。 |
ベンダー |
GPU ベンダー。 |
ドライバー |
システムにインストールされているグラフィックス・ドライバーのバージョン。 |
ステッピング |
マイクロプロセッサーのバージョン。 |
EU カウント |
レンダーと GPGPU エンジンの最大実行ユニット (EU) 数。このデータは、インテル® HD グラフィックスおよびインテル® Iris® グラフィックス (以降、「インテル® グラフィックス」) 固有です。 |
最大 EU スレッドカウント |
実行ユニットごとの最大スレッド数。このデータはインテル® グラフィックス固有です。 |
最大コア周波数 |
グラフィックス・プロセッサーの最大周波数。このデータはインテル® グラフィックス固有です。 |
グラフィックス・パフォーマンス解析 |
GPU メトリック収集は、ハードウェア・レベルで有効になります。このデータはインテル® グラフィックス固有です。 注一部のシステムでは、L3 ミス、メモリーアクセス、サンプラービジー、SLM アクセスなどの拡張メトリックの収集は BIOS で無効にされています。システムによっては、BIOS オプションを設定してこの収集を有効にできます。オプションの有無およびオプション名は BIOS ベンダーによって異なります。BIOS でインテル® グラフィックス・パフォーマンス・アナライザーのオプション (または等価なオプション) を有効に設定します。 |