QNX* ターゲット

インテル® VTune™ プロファイラーは、QNX* ターゲットシステム上でパフォーマンス・データの収集をサポートします。

Windows* や Linux* を実行するホストシステムから、ターゲット QNX* システムへのコマンドライン・インターフェイスを介したデータ収集が可能です。収集されたトレースは、イーサネット経由でホストシステムに転送され、以降の確認のため保存されます。収集が完了すると、パフォーマンス結果をインポートしてインテル® VTune™ プロファイラーのユーザー・インターフェイスで表示することができます。

ターゲットコレクターは、イメージのビルド中にターゲット QNX* イメージに統合でき、ターゲットのファイルシステムの 1MB しか必要としません。トレースはホストシステムに転送されるため、限られたストレージ容量を持つターゲットシステムや、読み取り専用のファイルシステムを使用するターゲットでも収集できます。

  1. 必要条件

  2. システムの設定

  3. 解析の実行

  4. 結果の表示と解釈

必要条件

システムの設定

ホストとターゲットシステムで次の手順に従って、コレクターをインストイールし、インテル® VTune™ プロファイラーを使用してパフォーマンス解析を有効にします。

  1. ホストシステムがイーサーネット経由でターゲットの QNX* システムに接続されていることを確認し、コマンドウィンドウからターゲット QNX* システムにログインします。

  2. ホストシステムの <install-dir>/target/qnx_x86_64/bin64/sep ファイルをターゲット QNX* システムにコピーし、共有ネットワークをマウントするか、ターゲットイメージに統合します。

  3. ホストシステムで、インテル® VTune™ プロファイラーのユーザー・インターフェイスを起動して、[新しいプロジェクト] をクリックしてプロジェクト名を指定し、[プロジェクトを作成] をクリックします。

  4. [解析の設定] をクリックし、[どこを] ペインで [ローカルホスト] を選択して、[バイナリーを検索] をクリックします。

  5. [バイナリー/シンボル検索] ウィンドウで、ホストシステム上のカーネルおよびアプリケーションのターゲットモジュールの場所を参照して、[OK] をクリックします。

解析の実行

解析は、ターゲット QNX* システムに以前インストールされたコレクターと、ホストの Windows* または Linux* システムで起動されたコマンドから実行されます。すべての結果はホストシステムに保存されます。

  1. ターゲットの QNX* システムで <sep-dir>/sep コマンドを実行します。

    <sep-dir>sep ファイルがコピーされた場所です。ターゲットのコレクターがロードされ、ホストシステムが接続されるのを待ちます。

  2. ホストシステムでは、次の解析コマンドを実行します。

    • コールスタック付きのホットスポット:
      <install-dir>/bin64/sep -start -d <duration> -target-ip <target-ip-address> -target-port 9321 -lbr call_stack -out <filename>.tb7

      コマンド例:

      /opt/intel/vtune_profiler/bin64/sep -start -d 60 -target-ip 12.345.67.89 -target-port 9321 -lbr call_stack -out hotspots_callstacks.tb7

      コールスタックはハードウェア・ベースであり、16 フレームの深さに制限されます。ハードウェアの制限により、取得されたコールスタックの深さは 16 フレーム未満になる可能性があります。

    • カスタム CPU イベント:
      <install-dir>/bin64/sep.exe -start -d <duration> -target-ip <target-ip-address> -target-port 9321 -ec "<event-list>" -out <filename>.tb7

      コマンド例:

      /opt/intel/vtune_profiler/bin64/sep.exe -start -d 60 -target-ip 12.345.67.89 -target-port 9321 -ec "MEM_LOAD_UOPS_RETIRED.DRAM_HIT,MEM_LOAD_UOPS_RETIRED.HITM,MEM_LOAD_UOPS_RETIRED.L2_HIT" -out custom.tb7

      詳細は、「SEP ユーザーガイド」 (英語) を参照してください。

  3. 解析を始めたら、ターゲット QNX* システムでアプリケーションを実行するか、またはすでに実行中であることを確認してください。解析はシステム全体のデータを収集します。指定した時間が経過すると、収集は自動的に停止します。

  4. 解析が完了したら、ターゲット QNX* システムでアプリケーションを停止するか、または停止していることを確認してください。

結果の表示と解釈

収集が完了すると、ホストシステムで *.tb7 結果ファイルが利用できます。

  1. ホストシステムで、*.tb7 ファイルを生成済みのプロジェクトにインポートします。

  2. [ホットスポット] ビューポイントに切り替えて、収集されたパフォーマンス・データを確認します。

    • ホットスポット・データを収集した場合、[ホットスポット] ビューポイントの [サマリー] ウィンドウから開始します。[上位のホットスポット] リストには、最も CPU 時間を消費した上位 5 つの関数が表示されます。[ボトムアップ] ウィンドウに表示される関数をダブルクリックすると、集計されたパフォーマンス・データと、収集全体のアクティビティーを示すタイムラインが表示されます。詳細は、「ホットスポット・ビュー」を参照してください。

    • CPU イベントデータを収集した場合、[マイクロアーキテクチャー全般] ビューポイントから始めます。詳細は、「マイクロアーキテクチャー全般ビュー」を参照してください。

関連情報