pspnet-pytorch¶
ユースケースと概要説明¶
pspnet-pytorch
は、セマンティック・セグメント化モデルで、21 のオブジェクト・クラスの Pascal VOC データセットで事前トレーニングされており、<omz_dir>/data/dataset_classes/voc_20cl_bkgr.txt
ファイルにリストされています。このモデルは、ResNetV1-50 バックボーンと PSP セグメント化ヘッドに基づいて構築されました。このモデルは、ピクセルレベルの予測タスクに使用されます。詳細は、リポジトリーとこちらをご覧ください。
仕様¶
メトリック |
値 |
---|---|
タイプ |
セマンティックのセグメント化 |
GFlops |
357.1719 |
MParams |
46.5827 |
ソース・フレームワーク |
PyTorch* |
入力¶
元のモデル¶
画像、名前: input.1
、形状: 1, 3, 512, 512
、形式: B, C, H, W
。
説明:
B
- バッチサイズC
- チャネル数H
- 画像の髙さW
- 画像の幅
予想される色の順序: RGB
。平均値: [123.675, 116.28, 103.53]、スケール値: [58.395, 57.12, 57.375]
変換されたモデル¶
画像、名前: input.1
、形状: 1, 3, 512, 512
、形式: B, C, H, W
。
説明:
B
- バッチサイズC
- チャネル数H
- 画像の髙さW
- 画像の幅
予想される色の順序: BGR
。
出力¶
元のモデル¶
[0, 20] 範囲の整数値。各画像ピクセルの予測クラスのインデックスを表します。名前: segmentation_map
、形状: 1, 1, 512, 512
、形式: B, 1, H, W
。
説明:
B
- バッチサイズH
- 画像の髙さW
- 画像の幅
変換されたモデル¶
[0, 20] 範囲の整数値。各画像ピクセルの予測クラスのインデックスを表します。名前: segmentation_map
、形状: 1, 1, 512, 512
、形式: B, 1, H, W
。
説明:
B
- バッチサイズH
- 画像の髙さW
- 画像の幅
モデルをダウンロードして OpenVINO™ IR 形式に変換¶
以下の例に示すように、モデルをダウンロードし、必要に応じてモデル・ダウンローダーやその他の自動化ツールによってモデルを OpenVINO™ IR 形式に変換できます。
モデル・ダウンローダーの使用例:
omz_downloader --name <model_name>
モデル・コンバーターの使用例:
omz_converter --name <model_name>
法務上の注意書き¶
元のモデルは、Apache License バージョン 2.0 に基づいて配布されています。ライセンスの内容は、<omz_dir>/models/public/licenses/APACHE-2.0-MMSegmentation-Models.txt
で確認できます。