この記事は、インテル® デベロッパー・ゾーンに掲載されている「Profiling OpenMP* applications with Intel® VTune™ Amplifier XE」 (http://software.intel.com/en-us/articles/profiling-openmp-applications-with-intel-vtune-amplifier-xe) の日本語参考訳です。
並列処理は、ハイパフォーマンス・コンピューティング(HPC)が必要とする性能を提供します。並列処理は、スーパースカラー、ベクトル命令、スレッド化と分散メモリーにおけるメッセージ・パッシングなどいくつかのレイヤーに渡って実行されます。OpenMP は、とりわけ HPC 分野で利用されているスレッド抽象化技術です。多くの HPC アプリケーションは、OpenMP と MPI* の両方を使用するハイブリッド型の共有メモリー/分散プログラミング・モデルに移行しつつあります。
この記事では、OpenMP 並列プログラミング・モデルと OpenMP ベースのアプリケーションのパフォーマンス・プロファイルに焦点を当てています。インテルが提供する強力なパフォーマンス・プロファイル・ツールであるインテル® Vtune™ Amplifier XE は、OpenMP コードのパフォーマンス上のボトルネックを検出する際に非常に役立ちます。この記事には、OpenMP アプリケーションをプロファイルする手順を示し、このツールで検出できる一般的なパフォーマンスの問題を説明します。
この続きは、以下の PDF をご覧ください。
添付ファイル | サイズ |
profiling-openmp-applications-with-intel-vtune-amplifier-xe.pdf | 3.37MB |
コンパイラーの最適化に関する詳細は、最適化に関する注意事項を参照してください。