アプリケーション・パフォーマンス・スナップショットとは

インテル® VTune™ プロファイラー

この記事は、インテル® デベロッパー・ゾーンに掲載されている「Introducing Application Performance Snapshot」の日本語参考訳です。


利用可能なハードウェア (CPU、FPU、およびメモリー) を MPI アプリケーションがどのように活用しているか、アプリケーション・パフォーマンス・スナップショットを使用して簡単に参照できます。アプリケーション・パフォーマンス・スナップショットは、アプリケーションの CPU と FPU 使用、I/O とメモリー・フットプリント、メモリーアクセスのストール、および MPI と OpenMP* の利用率を解析します。解析後、インテル® プラットフォームを使用するシステム上でのパフォーマンス拡張の可能性が示されます。アプリケーション・パフォーマンス解析の最初のステップとしてこのツールを使用して、主な最適化分野の簡単なスナップショットを取得します。

アプリケーション・パフォーマンス・スナップショットは、インテル® Developer Zone (https://software.intel.com/performance-snapshot) から、無料でダウンロードできます。このツールは、インテル® Parallel Studio XE またはインテル® VTune™ Amplifier の一部としてインストールされます。


バージョン 2018 ベータ版以降では、Linux* 向けのアプリケーション・パフォーマンス・スナップショットに MPI パフォーマンス・スナップショットのほとんどの機能が含まれるようになり、MPI パフォーマンス・スナップショットは独立したツールとしては利用できなくなりました。

新機能

このユーザーガイドは、アプリケーション・パフォーマンス・スナップショット Linux* 版向けです。

以下は、これまでの製品リリースの変更履歴です。

Application Performance Snapshot 2019 Update 4

  • インテル® MPI ライブラリーが提供するコミュニケーターの内部 ID を収集する機能が追加されました。この機能は、Application Performance Snapshot 2019 Update4 以降およびインテル® MPI ライブラリー 2019 Update4 以降でサポートされます。

Application Performance Snapshot 2019 Update 3

  • メッセージ量ごとの MPI アプリケーションの通信パターンをさらに適切に視覚化するため、HTML ベースのランク-ランク通信の分布図を追加しました。

Application Performance Snapshot 2019 Update 2

  • OpenMP* の機能を完全にサポートしました。
  • ベクトル化効率のメトリックが改善されました。
  • MPI インバランス時間は、収集のオーバーヘッドを最小化するためデフォルトの統計レベル 1 では計算されなくなりました。
  • aps-report: 選択した MPI 関数セットの統計のみを表示するオプションが追加されました。
  • MPI コレクターの一般的な最適化。

Application Performance Snapshot 2019 Update 1

  • MPI インバランス収集が、純粋なアプリケーションのインバランスを測定可能なモードで拡張されました。このモードは、MPICH とバイナリー互換な MPI 実装に適用できます。必要に応じて、インバランス収集をオフにして収集のオーバーヘッドを最小化できます。
  • MPI トレースにおけるオーバーヘッドの改善は、多数のランクがある状況では顕著に影響します。

Application Performance Snapshot 2019

  • インテル® Omni-Path アーキテクチャー・インターコネクト帯域幅とパケットレートのメトリックが追加され、MPI 通信のボトルネックを調査できるようになりました。
  • MPI アプリケーションの通信パターンをさらに適切に視覚化するため、HTML ベースのランク-ランク間通信の分布図が追加されました。

Application Performance Snapshot 2018 Update 3 および 2019 Beta Update

  • aps-report ユーティリティーに –format オプションが追加され、レポートをテキスト (*.txt) やカンマ区切り (*.csv) 形式で生成できます。CSV 形式は、レポート処理の自動化や Microsoft* Excel* などの表計算プログラムへのエクスポートに有用です。
  • 集約通信時間カラムによりランク-ランク間データ転送レポートが強化されました。
  • 圧縮とデフォルトで設定された最小統計レベルで MPI トレースファイルのサイズが小さくなりました。aps-report ユーティリティーで生成されたレポートには、最小の統計レベルでは適用できないものがあります。詳細については、「収集されるデータ量を制御」 (英語) を参照してください。
  • aps-report ユーティリティーでレポート生成時間が大幅に短縮されました。

Application Performance Snapshot 2018 Update 2

  • コミュニケーター・リスト (英語) がグラフに追加されました。
  • ランクごとの集合操作時間グラフに、-C-M オプションが追加されました。
  • データ収集制御が追加されました。「収集されるデータ量を制御」 (英語) を参照してください。
  • インテル® Trace Analyzer & Collector との統合が追加されました。「インテル® Trace Collector 向けの設定ファイルの作成」 (https://software.intel.com/en-us/application-snapshot-user-guide-creating-configuration-file-for-intel-trace-collector) を参照してください。

Application Performance Snapshot 2018 Update 1

  • MPI_Pcontrol 領域数の制限がなくなりました。

Application Performance Snapshot 2018

  • このツールは、aps.sh ではなく aps として起動されるようになりました。
  • 結果ディレクトリーが stat_* から aps_result_* に変更されました。

Application Performance Snapshot 2018 Beta

  • 最初のリリースです。

コンパイラーの最適化に関する詳細は、最適化に関する注意事項を参照してください。

タイトルとURLをコピーしました