インテル® VTune™ Amplifier 2018 ヘルプ
インテル® VTune™ Amplifier は、サンプルコードを使用してパフォーマンス解析の設定と解釈を手順を追って説明する Web チュートリアルを提供します。
インテル® デベロッパー・ゾーンからチュートリアル (https://software.intel.com/en-us/articles/intel-vtune-amplifier-tutorials (英語)) にアクセスできます。サンプルコードは、https://software.intel.com/en-us/product-code-samples (英語) から入手できます。
各種チューニングのシナリオが『インテル® VTune™ Amplifier クックブック』で紹介されています。
Linux* チュートリアル: HTML (英語) | PDF (英語)
Windows* チュートリアル: HTML (英語) | PDF (英語)
サンプル: tachyon_find_hotspots2D レイトレーシングを使用してグラフィック画像を描画する C++ アプリケーション。次の場所からサンプルコードにアクセスできます。
Linux*: <install_dir>/samples/<locale>/C++/tachyon_vtune_amp_xe.tgz
Windows*<install_dir>\samples\<locale>\C++\tachyon_vtune_amp_xe.zip
学習の目標:
実証: C++ アプリケーションの最も時間を消費するホットスポット関数とコード行を特定し、関数呼び出しフローを解析します。
パフォーマンスの問題: 不適切なアルゴリズムの選択、非効率な並列処理
使用する解析: 基本ホットスポット
Linux* チュートリアル: HTML (英語) | PDF (英語)
Windows* チュートリアル: HTML (英語) | PDF (英語)
サンプル: nqueens_parallelさまざまなボードサイズで Fortran の N クイーン問題を解決します。次の場所からサンプルコードにアクセスできます。
Linux*: <install_dir>/samples/<locale>/Fortran/nqueens_fortran.tgz
Windows*: <install_dir>/samples/<locale>/Fortran/nqueens_fortran.zip
実証: Fortran アプリケーションにおける最も時間を消費するプログラムユニットを特定し、利用可能な論理 CPU コア上でのスレッドの並列性を解析して、並列性を損ねる同期オブジェクトを特定します。
パフォーマンスの問題: スレッドの競合、非効率な並列処理
使用する解析: 基本ホットスポット、並行性、ロックと待機
Linux* チュートリアル: HTML (英語) | PDF (英語)
Windows* チュートリアル: HTML (英語) | PDF (英語)
サンプル: tachyon_analyze_locks2D レイトレーシングを使用してグラフィック画像を描画する C++ アプリケーション。次の場所からサンプルコードにアクセスできます。
Linux*: <install_dir>/samples/<locale>/C++/tachyon_vtune_amp_xe.tgz
Windows*: <install_dir>\samples\<locale>\C++\tachyon_vtune_amp_xe.zip
学習の目標:
実証: C++ アプリケーションの並列処理を妨げるロックを特定します。
パフォーマンスの問題: ロックと待機
使用する解析: ロックと待機
Linux* チュートリアル: HTML (英語) | PDF (英語)
サンプル: diskioシステム・ファイル・キャッシュとユーザーバッファーを使用する I/O デバイスのワークを含む C++ アプリケーション。次の場所からサンプルコードにアクセスできます。
Linux*: <install_dir>/samples/<locale>/C++/diskio_vtune_amp_xe.tgz
学習の目標:
実証: I/O 依存の C++ アプリケーションの非効率な I/O リソースの利用を特定します。
パフォーマンスの問題: CPU 利用のオーバーヘッド、長い I/O 待機時間、深い I/O キューの利用
使用する解析: ディスク I/O
Linux* チュートリアル: HTML (英語) | PDF (英語)
サンプル: linear_regression線形近似を得るためポイントの統計サマリーを生成する C アプリケーション。次の場所からサンプルコードにアクセスできます。
Linux*: <install_dir>/samples/<locale>/C++/linear_regression.tgz
学習の目標:
実証: C アプリケーションのフォルスシェアリングとその原因を特定します。
パフォーマンスの問題: フォルスシェアリング。
使用する解析: メモリーアクセス
Linux* チュートリアル: HTML
サンプル: heart_demo心臓活動の電気生理をシミュレーションする C++ アプリケーション。https://github.com/CardiacDemo/Cardiac_demo からサンプルコードにアクセスできます。
学習の目標:
実証: OpenMP* と MPI のハイブリッド・アプリケーションの問題を特定します。
使用する解析/ツール: アプリケーション・パフォーマンス・スナップショット (APS)、インテル® Trace Analyzer & Collector、およびインテル® VTune™ Amplifier の HPC パフォーマンス特性解析
Linux* チュートリアル: HTML (英語) | PDF (英語)
サンプル: tachyon_find_hotspots2D レイトレーシングを使用してグラフィック画像を描画する C++ アプリケーション。次の場所からサンプルコードにアクセスできます。
Linux*: <install_dir>/samples/<locale>/C++/tachyon_vtune_amp_xe.tgz
学習の目標:
実証: インテル® VTune™ Amplifier のサンプリング・ドライバーとアプリケーション解析向けに Yocto Project* 2.1 環境でビルドされたリモート Linux 組込みシステム設定し、最も時間を消費するプログラムユニットを特定します。
使用する解析: 高度なホットスポット
インテル® VTune™ Amplifier のサンプルコードのインストールとセットアップ:
インストール・ディレクトリーから書き込み可能なディレクトリー、または共有スペースにアーカイブファイルをコピーします。
アーカイブからサンプルを抽出します。
サンプルは非決定論的です。チュートリアル中で示されるスクリーンショットと皆さんの環境での実行結果は異なる可能性があります。
サンプルは、インテル® VTune™ Amplifier の機能を説明するために設計されており、特定のコードをチューニングする最良の方法を示すわけではありません。適用される解析とコードの性質により結果が異なるかもしれません。