unet-camvid-onnx-0001

ユースケースと概要説明

これは、セマンティック・セグメント化を実行するように設計された U-Net モデルです。モデルは、PyTorch* フレームワークを使用して、CamVid データセットで最初からトレーニングされました。トレーニングでは、クラスの重み付けに中央値頻度バランシングを使用しました。オリジナルの浮動小数点モデルの詳細については、U-Net: 生物医学画像セグメント化のための畳み込みネットワークを参照してください。

モデル入力は、BGR 順に 1, 3, 368, 480 の単一イメージで構成されるブロブです。ピクセル値は [0, 255] の範囲の整数です。

unet-camvid-onnx-0001 のモデル出力は、CamVid データセットの 12 クラスのいずれかに属する各入力ピクセルのピクセルごとの確率です。

  • ビルド

  • 電柱

  • 道路

  • 舗装

  • 標識

  • 車両

  • 歩行者

  • 自転車

  • ラベルなし

仕様

メトリック

GFlops

260.1

MParams

31.03

ソース・フレームワーク

PyTorch*

精度

品質メトリックは CamVid 検証データセットに基づいて計算されました。unlabeled クラスはメトリックの計算中に無視されました。

メトリック

mIoU

71.95%

  • IOU=TP/(TP+FN+FP)

    説明:

    • TP - 指定されたクラスの真陽性ピクセルの数

    • FN - 指定されたクラスの偽陰性ピクセルの数

    • FP - 指定されたクラスの誤検知ピクセルの数

入力

画像、形状: 1, 3, 368, 480、形式: B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル

  • H - 高さ

  • W - 幅

チャネルの順番は BGR

出力

セマンティック・セグメント化クラス確率マップ、形状 - 1, 12, 368, 480、出力データ形式 - B, C, H, W

説明:

  • B - バッチサイズ

  • C - [0, 1] 範囲のクラス C に属する入力ピクセルの予測確率

  • H - 入力ピクセルの水平座標

  • W - 入力ピクセルの垂直座標

デモの使い方

Open Model Zoo が提供する次のデモでこのモデルを使用して、その機能を確認できます。