この記事は、インテル® デベロッパー・ゾーンに掲載されている「Introducing Application Performance Snapshot」の日本語参考訳です。
利用可能なハードウェア (CPU、FPU、およびメモリー) を MPI アプリケーションがどのように活用しているか、アプリケーション・パフォーマンス・スナップショットを使用して簡単に参照できます。アプリケーション・パフォーマンス・スナップショットは、アプリケーションの CPU と FPU 使用、I/O とメモリー・フットプリント、メモリーアクセスのストール、および MPI と OpenMP* の利用率を解析します。解析後、インテル® プラットフォームを使用するシステム上でのパフォーマンス拡張の可能性が示されます。アプリケーション・パフォーマンス解析の最初のステップとしてこのツールを使用して、主な最適化分野の簡単なスナップショットを取得します。
アプリケーション・パフォーマンス・スナップショットは、インテル® Developer Zone (https://software.intel.com/performance-snapshot) から、無料でダウンロードできます。このツールは、インテル® Parallel Studio XE またはインテル® VTune™ Amplifier の一部としてインストールされます。
注
バージョン 2018 ベータ版以降では、Linux* 向けのアプリケーション・パフォーマンス・スナップショットに MPI パフォーマンス・スナップショットのほとんどの機能が含まれるようになり、MPI パフォーマンス・スナップショットは独立したツールとしては利用できなくなりました。
新機能
このユーザーガイドは、アプリケーション・パフォーマンス・スナップショット Linux* 版向けです。
以下は、これまでの製品リリースの変更履歴です。
Application Performance Snapshot 2019 Update 4
- インテル® MPI ライブラリーが提供するコミュニケーターの内部 ID を収集する機能が追加されました。この機能は、Application Performance Snapshot 2019 Update4 以降およびインテル® MPI ライブラリー 2019 Update4 以降でサポートされます。
Application Performance Snapshot 2019 Update 3
- メッセージ量ごとの MPI アプリケーションの通信パターンをさらに適切に視覚化するため、HTML ベースのランク-ランク通信の分布図を追加しました。
Application Performance Snapshot 2019 Update 2
- OpenMP* の機能を完全にサポートしました。
- ベクトル化効率のメトリックが改善されました。
- MPI インバランス時間は、収集のオーバーヘッドを最小化するためデフォルトの統計レベル 1 では計算されなくなりました。
- aps-report: 選択した MPI 関数セットの統計のみを表示するオプションが追加されました。
- MPI コレクターの一般的な最適化。
Application Performance Snapshot 2019 Update 1
- MPI インバランス収集が、純粋なアプリケーションのインバランスを測定可能なモードで拡張されました。このモードは、MPICH とバイナリー互換な MPI 実装に適用できます。必要に応じて、インバランス収集をオフにして収集のオーバーヘッドを最小化できます。
- MPI トレースにおけるオーバーヘッドの改善は、多数のランクがある状況では顕著に影響します。
Application Performance Snapshot 2019
- インテル® Omni-Path アーキテクチャー・インターコネクト帯域幅とパケットレートのメトリックが追加され、MPI 通信のボトルネックを調査できるようになりました。
- MPI アプリケーションの通信パターンをさらに適切に視覚化するため、HTML ベースのランク-ランク間通信の分布図が追加されました。
Application Performance Snapshot 2018 Update 3 および 2019 Beta Update
- aps-report ユーティリティーに –format オプションが追加され、レポートをテキスト (*.txt) やカンマ区切り (*.csv) 形式で生成できます。CSV 形式は、レポート処理の自動化や Microsoft* Excel* などの表計算プログラムへのエクスポートに有用です。
- 集約通信時間カラムによりランク-ランク間データ転送レポートが強化されました。
- 圧縮とデフォルトで設定された最小統計レベルで MPI トレースファイルのサイズが小さくなりました。aps-report ユーティリティーで生成されたレポートには、最小の統計レベルでは適用できないものがあります。詳細については、「収集されるデータ量を制御」 (英語) を参照してください。
- aps-report ユーティリティーでレポート生成時間が大幅に短縮されました。
Application Performance Snapshot 2018 Update 2
- コミュニケーター・リスト (英語) がグラフに追加されました。
- ランクごとの集合操作時間グラフに、-C、-M オプションが追加されました。
- データ収集制御が追加されました。「収集されるデータ量を制御」 (英語) を参照してください。
- インテル® Trace Analyzer & Collector との統合が追加されました。「インテル® Trace Collector 向けの設定ファイルの作成」 (https://software.intel.com/en-us/application-snapshot-user-guide-creating-configuration-file-for-intel-trace-collector) を参照してください。
Application Performance Snapshot 2018 Update 1
- MPI_Pcontrol 領域数の制限がなくなりました。
Application Performance Snapshot 2018
- このツールは、aps.sh ではなく aps として起動されるようになりました。
- 結果ディレクトリーが stat_* から aps_result_* に変更されました。
Application Performance Snapshot 2018 Beta
- 最初のリリースです。
コンパイラーの最適化に関する詳細は、最適化に関する注意事項を参照してください。