CPU/FPGA 相互作用解析

CPU/FPGA 相互作用解析を使用して、データ並列 C++ (SYCL*) または OpenCL* アプリケーションを実行する専用の FPGA を搭載したシステム上の CPU と FPGA のバランスを評価します。

CPU/FPGA 相互作用解析を使用して、実行されたカーネルの FPGA パフォーマンス、CPU と FPGA 間のメモリー転送合計時間、CPU と FPGA ワークロードの待機時間による影響を評価します。

インテル® VTune™ プロファイラーは、これらの FPGA デバイスメトリックを収集します。

解析の設定と実行

この手順に従って、CPU/FPGA 相互作用解析のオプションを設定します。

必要条件:

  1. インテル® VTune™ プロファイラー・ツールバーの (スタンドアロン GUI)/ (Visual Studio* IDE) [解析の設定] ボタンをクリックします。

    [解析の設定] ウィンドウが表示されます。

  2. [何を] ペインで次の操作を行います。

    • [アプリケーション] バーでホストの実行ファイルを指定します。

    • 必要に応じて、ホスト・アプリケーションの引数を [アプリケーションの引数] に指定します。

      CPU/FPGA 相互作用解析

  3. [どのように] ペインで ブラウズボタンをクリックします。

    • [アクセラレーター] グループから [CPU/FPGA 相互作用] 解析タイプを選択します。
    • CPU のサンプリング間隔をミリ秒単位で指定します。
    • 収集に CPU のコールスタックを含めるか選択します。
    • FPGA プロファイル・データのソースを指定します。
      • OpenCL* プロファイル API - このソースはホスト・アプリケーションのみをプロファイルします。
      • AOCL プロファイラー - このソースは、FPGA 向けの設定とホスト・アプリケーションをプロファイルします。

    この設定のコマンドラインを生成するには、 コマンドライン・ボタンをクリックします。

  4. [開始] ボタンをクリックして解析を実行します。

パフォーマンス・プロファイラー・ラッパーで収集された FPGA データをインポート

パフォーマンス・プロファイラー・ラッパーを使用して profile.json ファイル形式で FPGA プロファイル・データを収集した場合、それらをインテル® VTune™ プロファイラーにインポートできます。

収集済みデータの読み取りを高速化するには、profile.json を空のフォルダーにコピーして、コンパイル・ディレクトリー全体ではなくそのフォルダーだけをインポートします。

パフォーマンス・プロファイラー・ラッパーを使用してデータをプロファイルする方法 (oneAPI アプリケーションのみ) の詳細については、「FPGA 最適化ガイド」 (英語) を参照してください。

データを表示

CPU/FPGA 相互作用解析の結果は、[CPU/FPGA 相互作用] ビューポイントに表示されます。ビューポイントには次のウィンドウが含まれます。

次にすることは?

CPU/FPGA 相互作用ビューポイントを使用して以下を確認します。

関連情報