GPU エンジンが利用された時間のパーセンテージを示します。
インテル® VTune™ プロファイラーは、GPU オフロードおよびGPU 計算/メディア・ホットスポット解析を実行し、GPU 利用率メトリックに関する高レベルの情報を収集します。この情報は、[GPU オフロード] ビューポイントで確認できます。さらに詳しい情報を見るには、Linux* カーネルをリビルドして i915 Ftrace* イベント収集を有効にします。
[サマリー]、[プラットフォーム] および [グラフィックス] ウィンドウを使用して、アプリケーションと計算タスクレベルで GPU 利用率を調査します。
[サマリー] ウィンドウの GPU 利用率
システムが GPU 解析の要件を満たしている場合 (i915 ftrace イベント収集がサポートされる)、インテル® VTune™ プロファイラーは、少なくとも 1 つの DMA パケットが実行されたすべてのエンジンの詳細な GPU 利用率解析データを表示します。デフォルトでは、インテル® VTune™ プロファイラーは 80% 未満の GPU 利用率をパフォーマンスの問題として設定します。次の例では、アプリケーション経過時間の 85.9% が GPU エンジンで使用されています。
GPU 解析に使用するターゲット・プラットフォームに応じて、[サマリー] ウィンドウの [GPU 利用率] には GPU エンジンによって使用された時間 (秒単位) が示されます。GPU エンジンは並列に動作することがあり、GPU エンジンが要した時間は必ずしもアプリケーションの経過時間と同じではありません。
GPU 時間データは経過時間メトリックに関連付けることができます。GPU 時間の値は、特定の GPU エンジンが実行された経過時間の割合を示します。GPU 時間が経過時間の大部分を占めている場合、アプリケーションが GPU 依存であることは明白です。
システムが i915 ftrace イベント収集をサポートしていない場合、すべての GPU 利用率の統計は、ハードウェア・イベントをベースに計算され、レンダーと GPGPU エンジンに属性化されます。
[プラットフォーム] ウィンドウの GPU 利用率
各時点の GPU エンジンごとの GPU 利用率の概要を調査します。デフォルトで、[プラットフォーム] ウィンドウには GPU 利用率と GPU エンジンごとのソフトウェア・キューが表示されます。GPU で実行されるオブジェクト (黄色) にカーソルを移動すると、GPU 利用率の簡単なサマリーが表示されます。GPU 利用率は、GPU エンジンがワークロードを実行していた時間です。グラフの GPU 利用率を調査して、GPU エンジンの利用率 (黄の領域と空白) とハードウェアに追加のワークを送信する可能性を推測できます。GPU ソフトウェア・キューを表示して解析するには、キュー内のオブジェクト (パケット) を選択すると、インテル® VTune™ プロファイラーは対応するソフトウェア・キューをハイライト表示します。
ソフトウェア・キューが一杯になると、パケットの送信が抑制され、キューに空きができるまでユーザーモードのドライバーは CPU 側で待機します。このようなストールによってパフォーマンスが低下する可能性を確認するには、ハードウェアの負荷を減らして [グラフィックス] ウィンドウに切り替え、パケットを生成するスレッドの CPU 待機時間が少なくなっているか確認します。別の方法として、タスクによってキューに追加の負荷をかけ、キューの長さが増加するかを確認できます。
GPU 利用率が低くなっています。アプリケーション全体のパフォーマンスを高めるには、より多くのワークを GPU にオフロードすることを検討してください。