modnet-webcam-portrait-matting

ユースケースと概要説明

modnet-webcam-portrait-matting モデルは、MobileNetV2 バックボーンを使用した単一の入力画像を使用してリアルタイムでビデオ・ポートレート・マッティングを行う軽量マット客観的分解ネットワーク (MODNet) です。モデルは PyTorch* フレームワークで事前トレーニングされ、ONNX* 形式に変換されます。

詳細については、論文およびリポジトリーで説明されています。

仕様

メトリック

タイプ

背景マット

GFlops

31.1564

MParams

6.4597

ソース・フレームワーク

PyTorch*

精度

HumanMatting データセットで測定された精度

メトリック

平均値

標準値

MAD

5.66

6.21

MSE

762.52

1494.45

  • MAD - 絶対差の平均

  • MSE - 平均二乗誤差。

入力

元のモデル

画像、名前: input、形状: 1, 3, 512, 512、形式: B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル数

  • H - 画像の髙さ

  • W - 画像の幅

予想される色の順序: RGB。平均値: [127.5, 127.5, 127.5]、スケール値: 127.5

変換されたモデル

画像、名前: input、形状: 1, 3, 512, 512、形式: B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル数

  • H - 画像の髙さ

  • W - 画像の幅

予想される色の順序: BGR

出力

元のモデル

[0, 1] 範囲の値を持つアルファーマット。名前: output、形状: 1, 1, 512, 512、形式: B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル数

  • H - 画像の髙さ

  • W - 画像の幅

変換されたモデル

[0, 1] 範囲の値を持つアルファーマット。名前: output、形状: 1, 1, 512, 512、形式: B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル数

  • H - 画像の髙さ

  • W - 画像の幅

モデルをダウンロードして OpenVINO™ IR 形式に変換

以下の例に示すように、モデルをダウンロードし、必要に応じてモデル・ダウンローダーやその他の自動化ツールによってモデルを OpenVINO™ IR 形式に変換できます。

モデル・ダウンローダーの使用例:

omz_downloader --name <model_name>

モデル・コンバーターの使用例:

omz_converter --name <model_name>

デモの使い方

Open Model Zoo が提供する次のデモでこのモデルを使用して、その機能を確認できます。