インテル® VTune™ Amplifier 2018 ヘルプ

GPU In-kernel プロファイル

GPU In-kernel プロファイルを使用して、コード行ごとの GPU カーネル実行の解析し、メモリー・レイテンシーや非効率なカーネルのアルゴリズムによるパフォーマンスの問題を特定します。

この解析タイプは、インテル® マイクロアーキテクチャー開発コード名 Broadwell 以降をベースとするプロセッサーで利用できます。

GPU In-kernel プロファイルはコードをプロファイルして、設定に応じてパフォーマンス・クリティカルなコードブロックや GPU カーネルでのメモリーアクセスによる問題を特定するのに役立ちます。

GPU In-kernel プロファイルでは GPU ホットスポット解析よりも高いパフォーマンス上のオーバーヘッドが生じるため、ホットな GPU 計算タスク (GPU カーネル) を特定するため最初に GPU ホットスポット解析を実行して、その後 GPU In-kernel プロファイルで特定したカーネルを調査することを推奨します。

GPU In-kernel プロファイルでは次の主要なメトリックを提供します。

設定オプション

GPU In-kernel プロファイル解析を実行するには次の操作を行います。

必要条件: プロジェクトを作成し、解析ターゲットを指定します。

  1. インテル® VTune Amplifier ツールバーの [New Analysis (新規解析)] ボタンをクリックします。

    [Analysis Type (解析タイプ)] ウィンドウがアクティブな状態で [New Amplifier Result (新規 Amplifier 結果)] タブが開きます。

  2. 左ペインの解析ツリーから、[Platform Analysis (プラットフォーム解析)] > [GPU In-kernel Profiling (GPU In-kernel プロファイル)] を選択します。

    右側に [Analysis Configuration (解析オプション)] ペインが開きます。

    デフォルトでは、この解析タイプの [Trace OpenCL and Intel Media SDK programs (OpenCL* とインテル(R) Media SDK プログラムをトレース)] オプションは有効に設定されています。

  3. [Profiling mode (プロファイル・モード)] ドロップダウン・メニューから、解析する問題タイプを選択します。

    • [Basic blocks latency (基本ブロック・レイテンシー)] オプションは、非効率なアルゴリズムによって引き起こされる問題を特定するのに有効です。

    • [Memory latency (メモリー・レイテンシー)] オプションは、メモリーアクセスによるレイテンシーの問題を特定するのに役立ちます。GPU ホットスポット解析を行った場合、このオプションを使用して GPU カーネルがスループット依存であるか、メモリー依存であるかを特定します。

  4. オプションとして、特定のカーネルを (最小のオーバーヘッドで) 解析する場合、テーブルから注目するカーネルを選択します。必要であれば、各カーネル向けの [Instance step (サンプリング間隔)] を変更します。

  5. [Start (開始)] をクリックして解析を実行します。

ビューポイント

デフォルトでは、GPU In-kernel プロファイルの結果は GPU ホットスポット・ビューポイントに表示されます。[Summary (サマリー)] ウィンドウから最もホットな GPU 計算タスクを特定し、[Graphics (グラフィックス)] ウィンドウを開いてこのホットスポットで収集されたメトリックを調査できます。

GPU In-kernel プロファイル

[Graphics] ウィンドウでホットなカーネルをダブルクリックしてソースコードを開きます。

GPU In-kernel プロファイルは、カーネルソースのコード行ごとに実際の解析を表示します。デフォルトで、最もホットなカーネルコード行がハイライト表示されます。

カーネル・インスタンスごとに実行された GPU 命令のパフォーマンス特性を参照するには、[Assembly (アセンブリー)] 表示に切り替えます。

関連情報