このワークフローに従って、インテル® VTune™ プロファイラーを使用して、シリアルまたは並列アプリケーションのパフォーマンスのボトルネックを特定および解析します。このチュートリアルでは、matrix サンプル・アプリケーションを使用してワークフローを説明します。
以下のインテル® ソフトウェア・ツールを Linux* システムにダウンロードします。
インテル® VTune™ プロファイラー (英語) 2025.0 以降
両方のツールは、インテル® oneAPI ベース・ツールキット (英語) に含まれています。
このチュートリアルでは、インテル® oneAPI DPC++/C++ コンパイラーを使用して、解析の共通ベースラインを確立し、パフォーマンス向上を追跡します。別のコンパイラーを選択すると、このワークフローの結果が変わる可能性があります。
Matrix サンプル・アプリケーションのパフォーマンスの問題を見つけて修正するには、次の操作を行います。
アプリケーションのパフォーマンス・ベースラインを確立します。
Matrix アプリケーションのボトルネックを特定します。
メモリーアクセスのボトルネックがある場合はそれを解決します。
パフォーマンスの改善を評価します。
ベクトル化の問題があれば対処します。
次のステップを特定します。
パフォーマンスの向上を確認します。