colorization-v2

ユースケースと概要説明

colorization-v2 モデルは、画像の色付けを実行するように設計されたモデルのカラー化グループの 1 つです。モデルは ImageNet データセットでトレーニングされました。このモデルファミリーの詳細については、リポジトリーを確認してください。

モデルは LAB イメージの入力 L チャネルとして消費します。モデルは、LAB 画像の A チャネルと B チャネルを出力として予測します。

仕様

メトリック

タイプ

カラー化

GFLOPs

83.6045

MParams

32.2360

ソース・フレームワーク

PyTorch*

精度

精度メトリックは、モデルによって生成された画像と ImageNet データセットの実際の検証画像で計算されました。結果は 2000 枚の画像のサブセットで得られます。

メトリック

PSNR

26.99 dB

SSIM

0.90

また、前処理として VGG16 caffe モデルとカラー化を使用してメトリックを計算できます。以下の結果は、ImageNet データセットの検証画像から得られます。

受信した値の rgb - グレー - カラー化を前処理する場合:

メトリック

前処理を行った値

前処理なしの値

精度上位 1

57.75%

70.96%

精度上位 5

81.50%

89.88%

入力

元のモデル

画像、名前: data_l、形状: 1, 1, 256, 256、形式: B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル

  • H - 高さ

  • W - 幅

チャネルの順序は L チャネルです。

変換されたモデル

画像、名前: data_l、形状: 1, 1, 256, 256、形式: B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル

  • H - 高さ

  • W - 幅

チャネルの順序は L チャネルです。

出力

元のモデル

画像、名前: color_ab、形状: 1, 2, 256, 256、形式: B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル

  • H - 高さ

  • W - 幅

チャネル順序は LAB-image の AB チャネルです。

変換されたモデル

画像、名前: color_ab、形状: 1, 2, 256, 256、形式: B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル

  • H - 高さ

  • W - 幅

チャネル順序は LAB-image の AB チャネルです。

モデルをダウンロードして OpenVINO™ IR 形式に変換

以下の例に示すように、モデルをダウンロードし、必要に応じてモデル・ダウンローダーやその他の自動化ツールによってモデルを OpenVINO™ IR 形式に変換できます。

モデル・ダウンローダーの使用例:

omz_downloader --name <model_name>

モデル・コンバーターの使用例:

omz_converter --name <model_name>

デモの使い方

Open Model Zoo が提供する次のデモでこのモデルを使用して、その機能を確認できます。