modnet-photographic-portrait-matting¶
ユースケースと概要説明¶
modnet-photographic-portrait-matting
モデルは、MobileNetV2 バックボーンを使用した単一の入力画像を使用してリアルタイムで写真ポートレート・マッティングを行う軽量マット客観的分解ネットワーク (MODNet) です。モデルは PyTorch* フレームワークで事前トレーニングされ、ONNX* 形式に変換されます。
仕様¶
メトリック |
値 |
---|---|
タイプ |
背景マット |
GFlops |
31.1564 |
MParams |
6.4597 |
ソース・フレームワーク |
PyTorch* |
精度¶
HumanMatting データセットで測定された精度
メトリック |
平均値 |
標準値 |
---|---|---|
MAD |
5.21 |
5.13 |
MSE |
727.95 |
1196.28 |
MAD - 絶対差の平均
MSE - 平均二乗誤差。
入力¶
元のモデル¶
画像、名前: input
、形状: 1, 3, 512, 512
、形式: B, C, H, W
。
説明:
B
- バッチサイズC
- チャネル数H
- 画像の髙さW
- 画像の幅
予想される色の順序: RGB
。平均値: [127.5, 127.5, 127.5]、スケール値: 127.5
変換されたモデル¶
画像、名前: input
、形状: 1, 3, 512, 512
、形式: B, C, H, W
。
説明:
B
- バッチサイズC
- チャネル数H
- 画像の髙さW
- 画像の幅
予想される色の順序: BGR
。
出力¶
元のモデル¶
[0, 1] 範囲の値を持つアルファーマット。名前: output
、形状: 1, 1, 512, 512
、形式: B, C, H, W
。
説明:
B
- バッチサイズC
- チャネル数H
- 画像の髙さW
- 画像の幅
変換されたモデル¶
[0, 1] 範囲の値を持つアルファーマット。名前: output
、形状: 1, 1, 512, 512
、形式: B, C, H, W
。
説明:
B
- バッチサイズC
- チャネル数H
- 画像の髙さW
- 画像の幅
モデルをダウンロードして OpenVINO™ IR 形式に変換¶
以下の例に示すように、モデルをダウンロードし、必要に応じてモデル・ダウンローダーやその他の自動化ツールによってモデルを OpenVINO™ IR 形式に変換できます。
モデル・ダウンローダーの使用例:
omz_downloader --name <model_name>
モデル・コンバーターの使用例:
omz_converter --name <model_name>
法務上の注意書き¶
元のモデルは、Apache License バージョン 2.0 に基づいて配布されています。ライセンスの内容は、<omz_dir>/models/public/licenses/APACHE-2.0.txt
で確認できます。