インテル® VTune™ プロファイラーは、計算集約型のアプリケーションに基づく HPC パフォーマンス特性解析機能を備えています。
HPC パフォーマンス特性解析は、計算集約型またはスループットに依存するアプリケーションの CPU、メモリー、および FPU 利用率を最適化する可能性を特定するのに役立ちます。HPC パフォーマンス特性解析タイプは、アプリケーションのパフォーマンス変化を理解するための出発点です。この解析タイプを使用して、1 秒あたりの浮動小数点操作数 (GFLOPS) を増やし、アプリケーション全体の実行時間を短縮することで、アプリケーションのパフォーマンスを改善できます。解析で収集されるデータは、CPU、メモリー、および FPU 利用率に関連しています。また、OpenMP* や MPI ランタイム・ライブラリーを使用するアプリケーション向けの追加のスケーラビリティー・メトリックも用意されています。
vtune -collect hpc-performance [-knob <knobName=knobValue>] [--] <target>
Knob:sampling-interval、enable-stack-collection、collect-memory-bandwidth、dram-bandwidth-limits、analyze-openmp、collect-affinity。
HPC パフォーマンス特性解析で使用可能な knob (設定オプション) の最新情報は、次のコマンドで得られます。
vtune -help collect hpc-performance
次の例は、メモリー帯域幅解析を有効にして、Linux* 上のアプリケーションで HPC パフォーマンス特性解析を実行します。
vtune -collect hpc-performance -knob collect-memory-bandwidth=true ./home/test/myApplication
データ収集が完了したら、結果を表示するため次のいずれかの操作を行います。
コマンドラインからデータを表示するには、-report アクションを使用します。
コマンドラインから -report-output アクションを使用して、レポートを .txt または .csv ファイルに書き込みます。
インテル® VTune™ プロファイラーのグラフィック・インターフェイスで、収集した結果データ (*.vtune) を開きます。