インテル® VTune™ プロファイラーは、シリアルおよびマルチスレッド化されたアプリケーション向けのパフォーマンス解析ツールです。インテル® VTune™ プロファイラーを使用して、選択したアルゴリズムを解析します。利用可能なハードウェア・リソースから得られる、アプリケーションの潜在的なメトリックを特定します。
インテル® VTune™ プロファイラーは、インテル® VTune™ Amplifier の後継バージョンであり、名称が変更されました。
インテル® VTune™ プロファイラーを使用して、以下を検出および特定できます。
アプリケーションやシステム全体で最も時間を消費する (ホットな) 関数
利用可能なプロセッサー時間を効率的に利用していないコード領域
シーケンシャルなパフォーマンスとスレッド化されたパフォーマンスを最適化するコード領域の候補
アプリケーションのパフォーマンスに影響する同期オブジェクト
アプリケーションが時間を費やしている I/O 操作、コード位置、およびその理由
アプリケーションが CPU または GPU に依存するかどうか、およびコードを GPU に効率良くオフロードできるか
異なる同期メソッド、異なるスレッド数、または異なるアルゴリズムのパフォーマンスの影響
スレッドのアクティビティーと移行
データ共有、キャッシュミス、分岐予測ミスなど、コード内のハードウェアに関連する問題
使用モデル
インテル® VTune™ プロファイラーを Windows*、macOS*、または Linux* プラットフォームにインストールして、ローカルおよびリモートのターゲットシステムを解析します。
macOS* では、インテル® VTune™ プロファイラーをインストールしてリモート解析を実行し、収集されたデータを表示できます。ローカル macOS* のプロファイルはできません。
ウェブサーバーとしてインテル® VTune™ プロファイラーを使用します。これは、マルチユーザー環境では最適なソリューションです。
スタンドアロン GUI クライアントをインストールするか、インテル® VTune™ プロファイラーを Microsoft* Visual Studio* または Eclipse* などの IDE に統合します。
インテル® VTune™ プロファイラー 2021 以前のドキュメントは、ダウンロード版のみ提供されています。各製品バージョンでダウンロード可能なドキュメントの一覧は、次のページを参照してください。
この表は、インテル® VTune™ プロファイラーで利用できるホストとリモート・ターゲット・プラットフォームの解析タイプをまとめたものです。
解析 |
Windows* ターゲット |
Linux* ターゲット |
Android* ターゲット |
FreeBSD* ターゲット |
---|---|---|---|---|
+ |
+ |
+ |
||
+ |
+ |
|||
+ |
+ |
+ |
+ |
|
+ |
||||
IDE (Eclipse*/Visual Studio*) |
+ |
+ |
||
+ |
+ |
|||
+ |
+ |
+ |
+ |
|
+ |
+ |
|||
+ |
||||
+ |
+4 |
|||
+ |
||||
+ |
+ |
+ |
+ |
|
+ |
+² |
+ |
||
+¹ |
+¹ |
|||
+ |
+² |
|||
+² |
||||
+ |
+ |
+ |
||
+ |
||||
+ |
+ |
|||
+³ |
+³ |
|||
+ |
+ |
|||
+ |
+ |
|||
+ |
||||
+ |
+ |
|||
+ |
||||
電力解析 (視覚化のみ) |
+ |
+ |
+ |
1プレビューのみ。
2インテル® HD グラフィックスおよびインテル® Iris® グラフィックスのみ。
3EBS 解析のみ。
4ハードウェア・イベントべース・メトリックのみ。MMIO アクセス、DPDK、SPDK を除く。
インテル® VTune™ プロファイラーは、解析と結果の解釈を容易にする機能を提供します。
トップダウン・ツリー解析: アプリケーションにおけるパフォーマンス上重要な実行フローを理解するために使用します。
タイムライン解析: スレッドのアクティビティーとスレッド間の移行を解析します。
ITT API 解析: ITT API を使用してコード中の重要な移行ポイントをマークして、フレームあたりのパフォーマンス、タスクなどを解析します。
アーキテクチャー・ダイアグラム: GPU アーキテクチャー・ブロックごとの GPU ハードウェア・メトリックを調査することで、GPU OpenCL* アプリケーションを解析します。
ソース解析: 問題の原因を調査するため、ソース行ごとにパフォーマンス・データを表示します。
比較解析: 最適化後のパフォーマンスの変化を理解するため、最適化前と後のアプリケーションのパフォーマンス結果を比較します。
ポーズしてデータ収集を開始モード: コマンドバーにある [ポーズして開始] ボタンをクリックして、パフォーマンス・データを収集せずにアプリケーションを開始し、[再開] ボタンをクリックしてデータ収集を始めます。
グループ化: グリッドビューで異なる粒度でデータをグループ化して、異なる視点から問題を解析します。
ビューポイント: 解析結果向けに利用可能な事前設定されているウィンドウとペインを選択します。これは、特定の問題に注目するのに役立ちます。
ホットキーによる解析の開始と停止 (英語) バッチファイルを使用して開始と停止のホットキーを作成し、特定の解析を行います。
インテル® VTune™ プロファイラーは、アセンブリー・レベルの命令に関する特定の情報を利用するため、プログラム (ターゲット) にインテル® アーキテクチャー以外の命令が含まれていると、解析が正しく動作しないことがあります。この場合、インテルの命令のみを含むターゲット実行ファイルで解析を実行します。解析が完了した後は、インテル以外の命令を生成する最適化コンパイラー・オプションを使用できます。