pspnet-pytorch#

ユースケースと概要説明#

pspnet-pytorch は、セマンティック・セグメント化モデルで、21 のオブジェクト・クラスの Pascal VOC データセットで事前トレーニングされており、<omz_dir>/data/dataset_classes/voc_20cl_bkgr.txt ファイルにリストされています。このモデルは、ResNetV1-50 バックボーンと PSP セグメント化ヘッドに基づいて構築されました。このモデルは、ピクセルレベルの予測タスクに使用されます。詳細は、リポジトリーとこちらをご覧ください。

仕様#

メトリック	値
タイプ	セマンティックのセグメント化
GFlops	357.1719
MParams	46.5827
ソース・フレームワーク	PyTorch*

精度#

メトリック	値
mean_iou	70.1%

精度メトリックは、固定入力解像度 512x512 で取得されました。

入力#

元のモデル#

画像、名前: input.1、形状: 1, 3, 512, 512、形式: B, C, H, W、ここで:

B - バッチサイズ
C - チャネル数
H - 画像の髙さ
W - 画像の幅

予想される色の順序: RGB。平均値: [123.675, 116.28, 103.53]、スケール値: [58.395, 57.12, 57.375]

変換されたモデル#

画像、名前: input.1、形状: 1, 3, 512, 512、形式: B, C, H, W、ここで:

B - バッチサイズ
C - チャネル数
H - 画像の髙さ
W - 画像の幅

予想される色の順序: BGR。

出力#

元のモデル#

[0, 20] 範囲の整数値。各画像ピクセルの予測クラスのインデックスを表します。名前: segmentation_map、形状: 1, 1, 512, 512、形式: B, 1, H, W、ここで:

B - バッチサイズ
H - 画像の髙さ
W - 画像の幅

変換されたモデル#

[0, 20] 範囲の整数値。各画像ピクセルの予測クラスのインデックスを表します。名前: segmentation_map、形状: 1, 1, 512, 512、形式: B, 1, H, W、ここで:

B - バッチサイズ
H - 画像の髙さ
W - 画像の幅

モデルをダウンロードして OpenVINO™ IR 形式に変換#

以下の例に示すように、モデルをダウンロードし、必要に応じてモデル・ダウンローダーやその他の自動化ツールによってモデルを OpenVINO™ IR 形式に変換できます。

モデル・ダウンローダーの使用例:

omz_downloader --name <model_name>

モデル・コンバーターの使用例:

omz_converter --name <model_name>

デモの使い方#

このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します:

法務上の注意書き#

元のモデルは、Apache License バージョン 2.0 に基づいて配布されています。ライセンスの内容は、<omz_dir>/models/public/licenses/APACHE-2.0-MMSegmentation-Models.txt で確認できます。