この記事は、インテル® デベロッパー・ゾーンに掲載されている「Performance Analysis for Games and Graphics Applications」(https://software.intel.com/en-us/articles/performance-analysis-for-games-and-graphics-applications) の日本語参考訳です。
この記事の PDF 版はこちらからご利用になれます。
この記事は、インテル® GPA とインテル® VTune™ Amplifier の相違点を簡単にまとめたものです。それぞれのツールで解決できる問題の種類と利点が得られる開発者について説明します。
インテル® VTune™ Amplifier
ゲームプレイやゲームエンジン開発に携わるプログラマーに推奨されます。詳細なソースコードのプロファイル・データを利用して、物理特性や AI などの計算集約型タスクを最適化できます。インテル® VTune™ Amplifier は、シングルスレッドとマルチスレッドの両方のパフォーマンスのチューニングに必要な情報を提供します。
ゲーム開発者は、インテル® VTune™ Amplifier を使用して次のタスクを行うことができます。
- CPU 負荷の高いタスクの最適化:
- コードレベルにドリルダウンして、遅いタスク、関数、コード業、コールスタックを特定できます。
- キャッシュミス、分岐予測ミスなど、CPU が遅い理由を特定できます。
- CPU スレッドのパフォーマンス・チューニング: スレッド解析を使用して、スレッドのインバランスや過度なコンテキスト・スイッチなど、一般的な並列処理関連の問題を特定できます。
- ワークロード・バランスと CPU と GPU 間の相互作用の調整: 詳細なプロファイル・データを解析し、ゲームやエンジンが CPU 依存か GPU 依存かを特定して、計算パフォーマンスを向上できます。インテル® VTune™ Amplifier で詳細な解析を行い、CPU ボトルネックを特定して、サマリーを確認して関数レベルにドリルダウンします。
- フレームに関連付けて並べ替え: データをフレームに関連付けて、各フレームをタイムライン表示します。低速なフレームと高速なフレームを特定して、最も低速なフレームで実行されている関数のみを表示するようにデータをフィルターするか、タイムラインのパターンとフレーム・アクティビティーを関連付けます。
- キャッシュ利用の最適化: 帯域幅によって制限されるソフトウェアをチューニングして、ボトルネックであるメモリー・オブジェクトを特定します。
インテル® VTune™ Amplifier XE の詳細 >
インテル® グラフィックス・パフォーマンス・アナライザー (インテル® GPA)
インテル® GPA は、アーティスト、デザイナー、およびゲームエンジン・プログラマーに推奨されます。ゲームプレイ・プログラマーは、異なる機能を利用するため、インテル® VTune™ Amplifier と併用できます。インテル® GPA は、開発者がゲームやグラフィックスを多用するアプリケーションのパフォーマンスを向上できるように、強力なグラフィックス解析と最適化ツールを無料で提供します。
ゲーム開発者は、インテル® GPA を使用して次のタスクを行うことができます。
- グラフィックス・ワークロード (フレームのレンダリングなど) の最適化: 最適なゲームプレイと高いフレームレートを実現するため、パフォーマンス・ボトルネックを素早く見つけ、リアルタイムのハードウェア・メトリックを監視し、ライブ分析を実行して、問題を解決します。
- アプリケーションの最適化: DirectX*、OpenGL*、Vulkan*、Metal* などのグラフィックス API で記述されたアプリケーションを最適化します。複数のフレームを総合的に分析するか、API の描画呼び出しレベルまで単一のフレームのパフォーマンスを解析できます。
- CPU/GPU システムへの影響の評価: CPU/GPU 競合、キューの使用状況、同期の問題を特定します。
コンパイラーの最適化に関する詳細は、最適化に関する注意事項を参照してください。