インテル® VTune™ プロファイラーは、QNX* ターゲットシステム上でパフォーマンス・データの収集をサポートします。
Windows* や Linux* を実行するホストシステムから、ターゲット QNX* システムへのコマンドライン・インターフェイスを介したデータ収集が可能です。収集されたトレースは、イーサネット経由でホストシステムに転送され、以降の確認のため保存されます。収集が完了すると、パフォーマンス結果をインポートしてインテル® VTune™ プロファイラーのユーザー・インターフェイスで表示することができます。
ターゲットコレクターは、イメージのビルド中にターゲット QNX* イメージに統合でき、ターゲットのファイルシステムの 1MB しか必要としません。トレースはホストシステムに転送されるため、限られたストレージ容量を持つターゲットシステムや、読み取り専用のファイルシステムを使用するターゲットでも収集できます。
ホストシステム: Linux* や Windows* システムに QNX* BSP とインテル® VTune™ プロファイラーがインストールされていること。
ターゲットシステム: イーサーネットを介してホストシステムに接続された、インストルメント・カーネルで動作する QNX7* をサポートするプロセッサー。サポートされるプロセッサーには、インテル® Pentium® プロセッサー、インテル® Celeron® プロセッサー、Intel Atom® プロセッサー開発コード名 Apollo Lake や Denverton があります。
ホストシステムとターゲットシステム間のネットワーク接続でファイアーウォールを無効にします。
ホストとターゲットシステムで次の手順に従って、コレクターをインストイールし、インテル® VTune™ プロファイラーを使用してパフォーマンス解析を有効にします。
ホストシステムがイーサーネット経由でターゲットの QNX* システムに接続されていることを確認し、コマンドウィンドウからターゲット QNX* システムにログインします。
ホストシステムの <install-dir>/target/qnx_x86_64/bin64/sep ファイルをターゲット QNX* システムにコピーし、共有ネットワークをマウントするか、ターゲットイメージに統合します。
ホストシステムで、インテル® VTune™ プロファイラーのユーザー・インターフェイスを起動して、[新しいプロジェクト] をクリックしてプロジェクト名を指定し、[プロジェクトを作成] をクリックします。
[解析の設定] をクリックし、[どこを] ペインで [ローカルホスト] を選択して、[バイナリーを検索] をクリックします。
[バイナリー/シンボル検索] ウィンドウで、ホストシステム上のカーネルおよびアプリケーションのターゲットモジュールの場所を参照して、[OK] をクリックします。
解析は、ターゲット QNX* システムに以前インストールされたコレクターと、ホストの Windows* または Linux* システムで起動されたコマンドから実行されます。すべての結果はホストシステムに保存されます。
ターゲットの QNX* システムで <sep-dir>/sep コマンドを実行します。
<sep-dir> は sep ファイルがコピーされた場所です。ターゲットのコレクターがロードされ、ホストシステムが接続されるのを待ちます。
ホストシステムでは、次の解析コマンドを実行します。
コールスタック付きのホットスポット:
<install-dir>/bin64/sep -start -d <duration> -target-ip <target-ip-address> -target-port 9321 -lbr call_stack -out <filename>.tb7
コマンド例:
/opt/intel/vtune_profiler/bin64/sep -start -d 60 -target-ip 12.345.67.89 -target-port 9321 -lbr call_stack -out hotspots_callstacks.tb7
コールスタックはハードウェア・ベースであり、16 フレームの深さに制限されます。ハードウェアの制限により、取得されたコールスタックの深さは 16 フレーム未満になる可能性があります。
カスタム CPU イベント:
<install-dir>/bin64/sep.exe -start -d <duration> -target-ip <target-ip-address> -target-port 9321 -ec "<event-list>" -out <filename>.tb7
コマンド例:
/opt/intel/vtune_profiler/bin64/sep.exe -start -d 60 -target-ip 12.345.67.89 -target-port 9321 -ec "MEM_LOAD_UOPS_RETIRED.DRAM_HIT,MEM_LOAD_UOPS_RETIRED.HITM,MEM_LOAD_UOPS_RETIRED.L2_HIT" -out custom.tb7
詳細は、「SEP ユーザーガイド」 (英語) を参照してください。
解析を始めたら、ターゲット QNX* システムでアプリケーションを実行するか、またはすでに実行中であることを確認してください。解析はシステム全体のデータを収集します。指定した時間が経過すると、収集は自動的に停止します。
解析が完了したら、ターゲット QNX* システムでアプリケーションを停止するか、または停止していることを確認してください。
収集が完了すると、ホストシステムで *.tb7 結果ファイルが利用できます。
ホストシステムで、*.tb7 ファイルを生成済みのプロジェクトにインポートします。
[ホットスポット] ビューポイントに切り替えて、収集されたパフォーマンス・データを確認します。
ホットスポット・データを収集した場合、[ホットスポット] ビューポイントの [サマリー] ウィンドウから開始します。[上位のホットスポット] リストには、最も CPU 時間を消費した上位 5 つの関数が表示されます。[ボトムアップ] ウィンドウに表示される関数をダブルクリックすると、集計されたパフォーマンス・データと、収集全体のアクティビティーを示すタイムラインが表示されます。詳細は、「ホットスポット・ビュー」を参照してください。
CPU イベントデータを収集した場合、[マイクロアーキテクチャー全般] ビューポイントから始めます。詳細は、「マイクロアーキテクチャー全般ビュー」を参照してください。