< 目次

ワークフローを理解する

このワークフローに従って、インテル® VTune™ プロファイラーを使用して、シリアルまたは並列アプリケーションのパフォーマンスのボトルネックを特定および解析します。このチュートリアルでは、matrix サンプル・アプリケーションを使用してワークフローを説明します。

必要条件

以下のインテル® ソフトウェア・ツールを Linux* システムにダウンロードします。

両方のツールは、インテル® oneAPI ベース・ツールキット (英語) に含まれています。

  • このチュートリアルでは、インテル® oneAPI DPC++/C++ コンパイラーを使用して、解析の共通ベースラインを確立し、パフォーマンス向上を追跡します。別のコンパイラーを選択すると、このワークフローの結果が変わる可能性があります。

ワークフロー

Matrix サンプル・アプリケーションのパフォーマンスの問題を見つけて修正するには、次の操作を行います。

  1. アプリケーションのパフォーマンス・ベースラインを確立します。

    1. パフォーマンス・スナップショット解析を実行

    2. パフォーマンス・スナップショット解析の結果を解釈

  2. Matrix アプリケーションのボトルネックを特定します。

    1. ホットスポット解析を実行してデータを解釈

    2. メモリーアクセス解析を実行してデータを解釈

  3. メモリーアクセスのボトルネックがある場合はそれを解決します。

    1. メモリーの問題を修正し、アプリケーションを再コンパイル

  4. パフォーマンスの改善を評価します。

    1. パフォーマンス・スナップショット解析を実行して結果を解釈

  5. ベクトル化の問題があれば対処します。

    1. アプリケーションを再コンパイルし、HPC パフォーマンス特性解析を実行

    2. 異なるコンパイラー・オプションで再コンパイル

  6. 次のステップを特定します。

    1. マイクロアーキテクチャー全般解析を実行して解釈

  7. パフォーマンスの向上を確認します。

    1. 最適化の前後の結果を比較