インテル® Xeon Phi™ プロセッサー・ターゲット

次の図は、インテル® VTune™ プロファイラーを使用して、インテル® メニー・インテグレーテッド・コア (インテル® MIC) アーキテクチャー・ベースのインテル® Xeon Phi™ プロセッサー (開発コード名 Knights Landing と Knights Mill) で実行されるアプリケーションの解析とシステム全体の解析に必要な基本的な手順を示します。解析は、インテル® Xeon Phi™ プロセッサーのセルフブート版を搭載した Linux* ターゲットでサポートされます。事前定義解析タイプの HPC パフォーマンス特性、メモリーアクセス、マイクロアーキテクチャー全般、ホットスポットを実行するか、カスタム解析タイプを作成できます。

ユーザーモード・サンプリング・モードのホットスポットやスレッド化解析などのインストルメント・ベースの収集では、ワーカースレッド数が多いとオーバーヘッドが大きくなることがあります。代わりに、ハードウェア・イベントベース・サンプリング・モードのホットスポット解析や HPC パフォーマンス特性解析を使用して、アプリケーションのスケーラビリティーを調査します。

このワークフローは、解析処理を高速に行う推奨される手順です。インテル® Xeon Phi™ プロセッサー上でインテル® VTune™ プロファイラーの完全な収集を行うことは可能ですが、ファイナライズと視覚化に時間がかかる場合があります。ターゲットのインテル® Xeon Phi™ プロセッサー上で、通常の解析フローを直接実行できます。

必要条件

HPC パフォーマンス特性、メモリーアクセス、マイクロアーキテクチャー全般、またはホットスポット (ハードウェア・イベントベース・サンプリング・モード) などのハードウェア・イベントベース・サンプリング収集タイプでは、サンプリング・ドライバーをインストールすることを推奨します。サンプリング・ドライバーがインストールされていない場合、インテル® VTune™ プロファイラーは Linux* Perf* を使用して動作します。次のシステム構成の設定に注意してください。

1.インテル® Xeon Phi™ プロセッサーを搭載するターゲットシステムで解析を設定して実行

ターゲットシステムで解析を設定して実行するには、次の 2 つの方法があります。

2.ホストシステム上で結果を開く

結果をホストシステムにコピーします (ターゲットシステムで収集された結果がホストと共有されていない場合)。コマンドでファイナライズの遅延を指定した場合、ファイナライズを行います。

  1. SSH などを使用して結果をホストシステムにコピーします。

  2. [オプション] モジュールへのパスがターゲットシステムと異なる場合、結果ファイルと検索ディレクトリーを適切なバイナリーに指定して結果をファイナライズします。次に例を示します。
    vtune -finalize -r <my_result_dir> -search-dir <my_binary_dir>

3.解析結果を開いて解釈する

結果を表示する方法は 2 つあります。

関連情報