この記事は、インテル® デベロッパー・ゾーンに掲載されている「VTune™ Amplifier XE cannot associate with OpenCL* source file when running source view?」(https://software.intel.com/en-us/blogs/2014/09/16/vtunetm-amplifier-xe-cannot-associate-with-opencl-source-file-when-viewing-source) の日本語参考訳です。
64 ビットの Red Hat* オペレーティング・システムで試したところ、インテル® VTune™ Amplifier XE 2015 で OpenCL* アプリケーションの解析を行うことができました。
最初に、OpenCL* 2.0 対応のインテル® SDK for OpenCL* Application をダウンロードします。こちらのサイトにある [Free Download] リンクをクリックし、必要事項を入力して、パッケージ (ここでは intel_sdk_for_ocl_application_2014_4.6.0.92_x64.tgz) をダウンロードします。
OpenCL* runtime 14.2 for Intel® CPU and Intel® Xeon Phi™ coprocessors for Linux* (64-bit) もダウンロードし、インストールする必要があります (間違えてインテル® グラフィックス用のパッケージをダウンロードしないように注意してください。)
OpenCL* アプリケーションとして、Linux* 用の Monte Carlo サンプル (https://software.intel.com/en-us/vcsource/samples/monte-carlo) を使用します。
SDK とランタイム・ライブラリーをインストールしたら、Monte Carlo サンプルをビルドします。このとき、インテル® VTune™ Amplifier XE での解析に必要なデバッグ情報が生成されるように、Makefile に “-g” オプションを追加します。
次に、インテル® VTune™ Amplifier XE で OpenCL* アプリケーションのサンプリングを実行します。ここでは、General Exploration (全般解析) を使用します。
# amplxe-cl -collect general-exploration -knob enable-stack-collection=true -- ./montecarlo
amplxe: Collection started.To stop the collection, either press CTRL-C or enter from another console window: amplxe-cl -r /home/peter/MonteCarlo/r002ge -command stop.
amplxe: Warning: To enable hardware event-base[d] sampling, VTune Amplifier has disabled the NMI watchdog timer.The watchdog timer will be re-enabled after collection completes.
Platforms (1):
[0] Intel(R) OpenCL [Selected]
Devices (1):
[0] Intel(R) Core(TM) i7-2600K CPU @ 3.40GHz [Selected]
Build program options: "-D__DO_FLOAT__ -cl-denorms-are-zero -cl-fast-relaxed-math -cl-single-precision-constant -DNSAMP=262144"
Running Monte Carlo options pricing for 65536 options, with 262144 samples
Size of memory region for each array: 262144 bytes
Using risk free rate = 0.05 and volatility = 0.2
amplxe: Warning: The specified data limit of 500 MB is reached.Data collection is stopped.
amplxe: Collection detached.
…
収集されるデータのサイズは、デフォルトでは 500MB ですが、”-data-limit” を使用して変更できます。
データ収集後、amplxe-gui を使用して結果を表示します。
OpenCL* 関数をダブルクリックすると、“Cannot find source file for 1 (1 のソースファイルが見つかりません)” というメッセージが表示されます。
パスの指定で “montecarlo.cl” を選択すると、ソースビューでパフォーマンス・データを確認できます。
コンパイラーの最適化に関する詳細は、最適化に関する注意事項を参照してください。