インテル® VTune™ Amplifier 2018 ヘルプ

インテル® Xeon Phi™ プロセッサー (開発コード名: Knights Landing) ターゲット

次の図は、インテル® VTune™ Amplifier を使用したインテル® メニー・インテグレーテッド・コア (インテル® MIC) アーキテクチャー・ベースのインテル® Xeon Phi™ プロセッサー (開発コード名: Knights Landing) 上で実行されるアプリケーションの解析、またはシステム全体の解析における基本的なワークフローを示しています。セルフブート版のインテル® Xeon Phi™ プロセッサーの Linux* ターゲット上での解析がサポートされます。プロセッサー向けに事前定義された高度なホットスポット解析、メモリーアクセス解析、全般解析、HPC パフォーマンス特性解析を選択するか、カスタム解析タイプを作成して実行できます。

基本ホットスポット、並行性、ロックと待機などのインストルメント・ベースの収集では、ワーカースレッドの数が多いと大幅なオーバーヘッド生じます。アプリケーションのスケーラビリティーを調査するには、基本ホットスポットの代わりに高度なホットスポット、並行性やロックと待機の代わりに HPC パフォーマンス特性を使用してください。

必要条件:

HPC パフォーマンス特性、メモリーアクセス、全般解析、または高度なホットスポットなどのハードウェア・イベントベース・サンプリング収集タイプには、サンプリング・ドライバーをインストールすることを推奨します。サンプリングドライバーがインストールされていない場合、Linux* ではインテル® VTune™ Amplifier は Perf を使用します。次のシステム設定に留意してください。

このワークフローは、解析を素早く行うため推奨される手順です。インテル® Xeon Phi™ プロセッサー上でインテル® VTune™ Amplifier は完全なデータ収集を行うことができますが、ファイナライズと可視化は低速かもしれません。インテル® Xeon Phi™ プロセッサー・ベースのターゲット上でも、通常の解析フローを利用できます。

1.

インテル® Xeon Phi™ プロセッサーを搭載するターゲットシステムで解析の設定と実行を行う

ターゲットシステムで解析を設定して実行するには 2 つの方法があります。

  • ホストシステム上でファイナライズ (推奨する方法): インテル® Xeon Phi™ プロセッサー・ベースのシステム上では、ファイナライズを行わず解析のみを実行します。この方法では速やかに結果を生成できます。

    コマンドプロンプトから、ファイナライズ遅延オプションを指定してデータの収集を行い、ホストシステムでシンボル解決を行うためバイナリー・チェックサムを計算します。例えば、メモリーアクセス解析を実行するには amplxe-cl -collect memory-access -finalization-mode=deferred -r <my_result_dir> ./my_app を使用します。

    詳細については、amplxe-cl コマンド構文ファイナライズ・モードをご覧ください。

    ヒント

    次に示すように、インテル® VTune™ Amplifier の GUI を使用して、コマンドラインを生成することができます。コマンドを生成したら、コマンドに -finalization-mode=deferred オプションを追加して、ファイナライズを延期させます。

  • ターゲットシステムでのファイナライズ: ホストシステム上でインテル® VTune™ Amplifier GUI を使用して、インテル® Xeon Phi™ プロセッサーを搭載するターゲットシステム向けにコマンドラインを生成します。ターゲットシステム上で実行とファイナライズを行います。この方法では、結果の生成に時間がかかります。

    1. [Analysis Target (解析ターゲット)] ウィンドウで、[Arbitrary Targets (任意のターゲット)] ボタンをクリックして [local host (ローカルホスト)] ターゲットシステムを選択します。

    2. プロセッサー・アーキテクチャーをインテル® プロセッサー開発コード名 Knights Landing に設定し、オペレーティング・システム・タイプを指定します。

    3. アプリケーション名と引数を入力します。

    4. [Use MPI Launcher (MPI ランチャーを使用)] チェックボックスをオンにし、ランチャー名、ランク数、プロファイルするランク、および結果の場所を指定します。

    5. [Choose Analysis (解析の選択)] をクリックして、[Analysis Type (解析タイプ)] ウィンドウに切り替えます。

    6. 解析タイプを選択し設定します。

    7. ウィンドウの下にある [Command Line (コマンドライン)] ボタンをクリックして、コマンドラインを生成します。

    8. 生成したコマンドラインをターゲットシステムのコマンドプロンプトにコピーして、解析を実行します。解析が完了するとファイナライズが始まります。ファイナライズにはしばらく時間がかかります。

2.

ホストシステムで結果を開く

結果をホストシステムへコピーします (ターゲットシステムで収集された結果が、ホストシステムと共有されていない場合)。コマンドがファイナライズの遅延を指示している場合、結果をファイナライズします。

  1. SSH などを使用して、結果をホストシステムへコピーします。

  2. (オプション操作) モジュールへのパスがターゲットシステムと異なる場合、結果ファイルと関連バイナリーの検索ディレクトリーを指定してファイナライズします。例: amplxe-cl -finalize -r <my_result_dir> -search-dir <my_binary_dir>

3.

解析結果の表示と解釈

結果を見るには次の 2 つの方法があります。

関連情報