この記事は、インテル® デベロッパー・ゾーンに公開されている「Practice of using VTune™ Amplifier XE 2015 on GPU for OpenCL™ kernel analysis」 (https://software.intel.com/en-us/blogs/2014/10/15/practice-of-using-vtune-amplifier-xe-2015-on-gpu-for-opencl-kernel-analysis) の日本語参考訳です。
インテル® SDK for OpenCL™ Application を使用すると、インテル® HD グラフィックス上で動作するアプリケーションを作成することができます。VTune™ Amplifier XE 2015 は、以下の GPU 上の OpenCL* アプリケーションのパフォーマンスを解析できます:
- GPU usage (GPU 利用状況)
- GPU hardware metrics (GPU ハードウェア・メトリック)
- OpenCL* カーネル実行
Windows* OS 上で OpenCL* アプリケーションをビルドして実行するには、次のような環境が必要です:
- インテル® SDK for OpenCL* Applications 2014 以降
- Microsoft* Visual Studio* 2010 以降
- Microsoft* DirectX* SDK (June 2010) – グラフィックスを使用するサンプルを実行するために必要
注意: インテル® HD グラフィックスのドライバーをインストールする際の特別な要求事項はありません。インテル® HD グラフィックスをサポートするドライバーを OEM から入手してインストールするだけです。
GPU データを取集するには、3 つの方法で VTune™ Amplifier XE 2015 を実行できます:
- Microsoft* Visual Studio* から起動
- VTune™ Amplifier XE スタンドアロン・アプリケーション (amplxe-gui) を起動
- VTune™ Amplifier XE コマンドライン (amplxe-cl) を起動
注意: OpenCL* アプリケーションがインテル® HD グラフィックス上で適切に動作するよう、管理者権限で VTune Amplifier XE を起動する必要があります。
ここで使用した OpenCL* のサンプルコード monte-carlo は https://software.intel.com/en-us/vcsource/samples/monte-carlo で入手できます。
コマンドライン:
>”C:\Program Files (x86)\Intel\VTune Amplifier XE 2015\bin32\amplxe-cl” -collect advanced-hotspots -knob collection-detail=stack-sampling -knob enable-gpu-usage=true -knob gpu-counters-mode=global-local-accesses — C:\temp\MonteCarlo\MonteCarlo\Win32\Debug\MonteCarlo.exe
>”C:\Program Files (x86)\Intel\VTune Amplifier XE 2015\bin32\amplxe-cl” -collect advanced-hotspots -knob collection-detail=stack-sampling -knob enable-gpu-usage=true -knob gpu-counters-mode=overview — C:\temp\MonteCarlo
\MonteCarlo\Win32\Debug\MonteCarlo.exe
パフォーマンス・データを収取した後、GPU エンジンなどが使用する GPU 時間を表示できます。
コンパイラーの最適化に関する詳細は、最適化に関する注意事項を参照してください。