fastseg-large

ユースケースと概要説明

fastseg-large は、<omz_dir>/data/dataset_classes/cityscapes_19cl_bkgr.txt ファイルにリストされている 19 のオブジェクト・クラスの Cityscapes データセットで事前トレーニングされた、正確なリアルタイム・セマンティック・セグメント化モデルです。詳細については、Cityscapes クラスの定義を参照してください。このモデルは、MobileNetV3 の大きなバックボーンと、LR-ASPP に基づいて修正されたセグメント化ヘッドに基づいて構築されました。このモデルは、現実世界のさまざまな道路画像の効率的なセグメント化に使用できます。モデル実装の詳細については、元のリポジトリーを参照してください。

仕様

メトリック

タイプ

セマンティックのセグメント化

GOps

140.9611

MParams

3.2

ソース・フレームワーク

PyTorch*

精度

メトリック

mean_iou

72.67%

入力

元のモデル

画像、名前: input0、形状: 1, 3, 1024, 2048、形式: B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル数

  • H - 画像の髙さ

  • W - 画像の幅

予想される色の順序: RGB。平均値: [123.675, 116.28, 103.53]、スケール値: [58.395, 57.12, 57.375]

変換されたモデル

画像、名前: input0、形状: 1, 3, 1024, 2048、形式: B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル数

  • H - 画像の髙さ

  • W - 画像の幅

予想される色の順序: BGR

出力

元のモデル

浮動小数点値。各画像ピクセルの予測クラスのスコアを表します。このモデルは、19 カテゴリーのオブジェクトを含む Cityscapes データセットでトレーニングされました。名前: output0、形状: 1, 19, 1024, 2048、形式: B, N, H, W

説明:

  • B - バッチサイズ

  • N - クラス数

  • H - 画像の髙さ

  • W - 画像の幅

変換されたモデル

浮動小数点値。各画像ピクセルの予測クラスのスコアを表します。このモデルは、19 カテゴリーのオブジェクトを含む Cityscapes データセットでトレーニングされました。名前: output0、形状: 1, 19, 1024, 2048、形式: B, N, H, W

説明:

  • B - バッチサイズ

  • N - クラス数

  • H - 画像の髙さ

  • W - 画像の幅

モデルをダウンロードして OpenVINO™ IR 形式に変換

以下の例に示すように、モデルをダウンロードし、必要に応じてモデル・ダウンローダーやその他の自動化ツールによってモデルを OpenVINO™ IR 形式に変換できます。

モデル・ダウンローダーの使用例:

omz_downloader --name <model_name>

モデル・コンバーターの使用例:

omz_converter --name <model_name>

デモの使い方

Open Model Zoo が提供する次のデモでこのモデルを使用して、その機能を確認できます。