modnet-webcam-portrait-matting#

ユースケースと概要説明#

modnet-webcam-portrait-matting モデルは、MobileNetV2 バックボーンを使用した単一の入力画像を使用してリアルタイムでビデオ・ポートレート・マッティングを行う軽量マット客観的分解ネットワーク (MODNet) です。モデルは PyTorch* フレームワークで事前トレーニングされ、ONNX* 形式に変換されます。

詳細については、論文およびリポジトリーで説明されています。

仕様#

メトリック	値
タイプ	背景マット
GFlops	31.1564
MParams	6.4597
ソース・フレームワーク	PyTorch*

精度#

HumanMatting データセットで測定された精度

メトリック	平均値	標準値
MAD	5.66	6.21
MSE	762.52	1494.45

MAD - 絶対差の平均
MSE - 平均二乗誤差。

入力#

元のモデル#

画像、名前: input、形状: 1, 3, 512, 512、形式: B, C, H, W、ここで:

B - バッチサイズ
C - チャネル数
H - 画像の髙さ
W - 画像の幅

予想される色の順序: RGB。平均値: [127.5, 127.5, 127.5]、スケール値: 127.5

変換されたモデル#

画像、名前: input、形状: 1, 3, 512, 512、形式: B, C, H, W、ここで:

B - バッチサイズ
C - チャネル数
H - 画像の髙さ
W - 画像の幅

予想される色の順序: BGR。

出力#

元のモデル#

[0, 1] 範囲の値を持つアルファマット。名前: output、形状: 1, 1, 512, 512、形式: B, C, H, W、ここで:

B - バッチサイズ
C - チャネル数
H - 画像の髙さ
W - 画像の幅

変換されたモデル#

[0, 1] 範囲の値を持つアルファマット。名前: output、形状: 1, 1, 512, 512、形式: B, C, H, W、ここで:

B - バッチサイズ
C - チャネル数
H - 画像の髙さ
W - 画像の幅

モデルをダウンロードして OpenVINO™ IR 形式に変換#

以下の例に示すように、モデルをダウンロードし、必要に応じてモデル・ダウンローダーやその他の自動化ツールによってモデルを OpenVINO™ IR 形式に変換できます。

モデル・ダウンローダーの使用例:

omz_downloader --name <model_name>

モデル・コンバーターの使用例:

omz_converter --name <model_name>

デモの使い方#

このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します:

バックグラウンド減算 Python* デモ

法務上の注意書き#

元のモデルは、Apache License バージョン 2.0 に基づいて配布されています。ライセンスの内容は、<omz_dir>/models/public/licenses/APACHE-2.0.txt で確認できます。