コマンドラインから 2 つの結果を比較すると、アプリケーションの回帰を簡単に確認できます。次の構文を使用して、指定する解析結果の差分レポートを作成します。
vtune -report <report_name> -r <result1_path> -r <result2_path>
説明:
この例は、Linux* 上で収集されたホットスポット解析結果 r001hs と r002hs を比較し、解析したアプリケーションの各関数の CPU 時間差を表示します。最適化されたアプリケーション (r002hs) の結果では、新しいメイン関数は 0.010 秒で実行されており、ホットスポット関数 algorithm_2 は 1.678 秒まで最適化されています。
vtune -report hotspots -r r001hs -r r002hs
Function Module Result 1:CPU Time Result 2:CPU Time Difference:CPU Time algorithm_1 matrix 1.225 1.222 0.003 algorithm_2 matrix 3.280 1.602 1.678 main matrix 0 0.010 -0.010
vtune コマンドを使用して、コードの回帰を毎日テストします。
ベースラインを作成します。
vtune ツールを実行して、特定の解析タイプでターゲットを解析します。次に例を示します。
Linux*:
vtune -collect hotspots -- sample
Windows*:
vtune -collect hotspots -- sample.exe
このコマンドは、sample または sample.exe ターゲットのホットスポット解析を実行して、その結果を現在の作業ディレクトリーに書き込みます。サマリーレポートは標準出力に書き込まれます。
以降の解析でベースラインとして使用するレポートを生成します。次に例を示します。
vtune -report hotspots -result-dir r001hs
これにより、sample または sample.exe ターゲットのそれぞれの関数の CPU 時間を示すホットスポット・レポートが作成されます。
ターゲット・アプリケーションを最適化するため、ソースコードを更新します。
スクリプトを作成して実行します。
Windows*: インテル® VTune™ プロファイラーのインストール・フォルダーの sep-vars.cmd を起動して環境を設定します。
vtune コマンドを起動してパフォーマンス・データを収集します。
vtune コマンドを実行して、現在の結果と初期のベースライン結果を比較し、その差を表示します。次に例を示します。
vtune -R hotspots -r r001hs -r r002hs
この例は、結果 r001hs と r002hs の各関数の CPU 時間を比較し、計算結果と両方の結果を並べて表示します。パフォーマンス値間の正差分は、結果 2 に対する改善を示します。また、負差分は回帰を示します。
同じ解析タイプまたはパフォーマンス・メトリックの結果のみを比較できます。
回帰が検出されない場合、テストは合格です。
定期的に 2 から 4 の手順を繰り返します。
インテル® VTune™ プロファイラーをスタンドアロン・コンポーネントとしてダウンロードした場合でも、インテル® oneAPI ベース・ツールキットとしてダウンロードした場合でも、デフォルトのインストール・パス <install-dir> は次のようになります。
オペレーティング・システム | <install-dirpath> へのパス |
---|---|
Windows* |
|
Linux* |
|
macOS* |
/opt/intel/oneapi/ |
OS 固有のインストールの手順については、「インテル® VTune™ プロファイラー・インストール・ガイド」 (英語) を参照してください。