インテル® VTune™ Amplifier 2018 ヘルプ
アプリケーションに適した解析タイプを見つけるには、Welcome ページにある [Find Your Analysis (解析の特定)] リンクが役立ちます。
インテル® VTune™ Amplifier には、次のようなパフォーマンス解析の基本カテゴリーがあります。
定義済みの解析タイプ
各カテゴリーは、それぞれのパフォーマンス解析ツリーの最上位の分類項目です。製品のグラフィカル・インターフェイスやコマンドライン・インターフェイス (amplxe-cl) を使用して、利用可能な解析タイプの実行を選択します。
GUI から解析タイプを選択して設定する:
プロジェクトを作成し、解析ターゲットを設定します。
次のいずれかの方法で、[Analysis Type (解析タイプ)] ウィンドウを開きます。
[New Analysis (新規解析)] ツールバーボタンをクリックします。
[Configure Project (プロジェクトの設定)] ツールバーボタンをクリックするか、製品メニューから [Configure Project...] を選択し、[Analysis Type] タブをクリックします。
インテル® VTune™ Amplifier の解析タイプは、次のデータ収集タイプのいずれかをベースにします。
ハードウェア・イベントベース・サンプリング収集 (ドライバーベースとドライバーを必要としないモード)。オプションでスタック収集も追加できます。
それぞれの解析タイプは、コードの問題を洗い出して最適化の方法を理解するのに役立つパフォーマンス・メトリックを提供します。
インテル® VTune™ Amplifier は、リモート Android* と Linux* プラットフォーム上で、GUI とコマンドラインを使用してローカルとリモートデータ収集モードをサポートします。
アルゴリズム解析では、ソフトウェア・チューニングに必要な解析タイプを提供します。現在のアルゴリズムの非効率な領域を理解するため、データを収集して解析を行い、アプリケーションのパフォーマンスを改善します。
アルゴリズム解析には、次の解析タイプが含まれます。
Basic Hotspots (基本ホットスポット): 特定のターゲットで CPU 時間を最も費やしている関数を特定し、各関数のコールツリーを復元して、スレッドのアクティビティーを表示します。
Advanced Hotspots (高度なホットスポット): オペレーティング・システムを含むシステム上のすべてのソフトウェアの実行を監視します。サンプリング・コレクターは、指定されたサンプリング間隔でプロセッサーに割り込みをかけ、命令アドレスを収集します。
Concurrency (並行性): 特定のターゲットで CPU 時間を最も費やしている関数を特定し、利用可能な論理 CPU コアの数に対してアプリケーションがどの程度効率良くスレッド化されているか表示します。この解析タイプは Android* システム上でのリモートデータ収集ではサポートされません。
Locks and Waits (ロックと待機): 効率が悪い CPU の使用を招く同期オブジェクトを特定するのに役立ちます。インテル® System Studio では、この解析タイプは Android* システム上でのリモートデータ収集ではサポートされません。
Memory Consumption (メモリー消費): 時間経過におけるメモリー (RAM) 消費量を調査し、実行中のメモリー・オブジェクトの割り当てと解放を特定するため、Linux* ネイティブまたは Python* ターゲットを解析します。
計算集約型のアプリケーション解析は、大量の計算を伴うアプリケーション・ベースの解析タイプです。これは、ほかのターゲット解析タイプを実行する前に、アプリケーションのパフォーマンス解析の出発点として使用できます。
計算集約型のアプリケーション解析には、次の解析タイプが含まれます。
HPC Performance Characterization (HPC パフォーマンス特性): 浮動小数点演算とメモリー効率に対するアプリケーションの計算負荷とスループットを評価します。アプリケーションのパフォーマンスの概要を理解するための出発点として使用できます。
マイクロアーキテクチャー解析は、現代のハードウェアで実行されるコードの効率を推測するのを支援する解析タイプです。
General Exploration (全般解析): アプリケーションのパフォーマンスに影響する大部分のハードウェアの問題を特定するのに役立ちます。ハードウェア・レベルの解析を行う際の出発点として使用してください。
Memory Access (メモリーアクセス): メモリーアクセスに関連する問題 (NUMA アーキテクチャー固有の問題など) を特定する一連のメトリックを測定します。
SGX Hotspots (インテル® SGX ホットスポット): インテル® ソフトウェア・ガード・エクステンションズ (インテル® SGX) 機能が有効なシステム上で、セキュリティーで保護されたパフォーマンス上重要なプログラムユニットを特定するのに役立ちます。
TSX Exploration (インテル® TSX の調査): インテル® トランザクショナル・シンクロナイゼーション・エクステンション (インテル® TSX) をサポートするインテル® プロセッサー向けです。インテル® TSX の使用とトランザクション・アボートの原因を解析するのに役立ちます。
TSX Hotspots (インテル® TSX ホットスポット): インテル® TSX をサポートするインテル® プロセッサー向けです。トランザクション内部のホットスポットを解析するのに有効です。
プラットフォーム解析は、アプリケーション/システムの CPU、GPU、および電力の使用率を監視する解析タイプを提供します。
CPU/GPU Concurrency (CPU/GPU 並行性): プラットフォーム上の各種 CPU と GPU コアのコード実行を調査し、CPU と GPU のアクティビティーを関連付けて、アプリケーションが GPU 依存か CPU 依存かを特定するのを可能にします。
GPU Hotspots (GPU ホットスポット): レンダリング、ビデオ処理、および計算にグラフィックス処理ユニット (GPU) を使用するアプリケーション向けです。CPU/GPU の並行性解析を行い、アプリケーションが GPU 依存であることが特定された場合、GPU ホットスポット解析によりさらに詳しく時間を消費する GPU 計算タスクを特定して、GPU ハードウェアごとのパフォーマンスを解析します。
GPU In-kernel プロファイル: GPU 依存のアプリケーションを対象としてコード行ごとの GPU カーネル実行の解析を支援し、メモリー・レイテンシーや非効率なカーネルのアルゴリズムによるパフォーマンスの問題を特定します。この解析タイプには高いオーバーヘッドがあります。
System Overview (システム全体): Linux* や Android* システムの一般的な動作を監視し、割り込み要求 (IRQ) 処理の電力とパフォーマンスを関連付ける、ドライバーを使用しないイベントベース・サンプリング解析です。
Disk Input and Output (ディスク I/O): (Windows* ではプレビュー機能) ディスク・サブシステム、CPU、およびプロセッサー・バスの使用率を監視します。
プレビュー機能は、正式リリースに含まれるかどうかは未定です。皆さんが有用性に対するフィードバックを送ることで、将来の採用決定の判断に役立ちます。プレビュー機能で収集されたデータは、将来のリリースで下位互換が提供される保証はありません。parallel.studio.support@intel.com へフィードバックをお送りください。
インテル® VTune™ Amplifier の [Analysis Type] ウィンドウで示されるすべての解析タイプは、インテルの設計者により事前定義されたデフォルトのオプションセットを含んでいます。利用可能な収集タイプや既存の事前設定された解析をベースに、カスタム解析タイプを作成することができます。