unet-camvid-onnx-0001#
ユースケースと概要説明#
これは、セマンティック・セグメント化を実行するように設計された U-Net モデルです。モデルは、PyTorch* フレームワークを使用して、CamVid データセットで最初からトレーニングされました。トレーニングでは、クラスの重み付けに中央値頻度バランシングを使用しました。オリジナルの浮動小数点モデルの詳細については、U-Net: 生物医学画像セグメント化のための畳み込みネットワークを参照してください。
モデル入力は、BGR
順に 1, 3, 368, 480
の単一イメージで構成されるブロブです。ピクセル値は [0, 255] の範囲の整数です。
unet-camvid-onnx-0001
のモデル出力は、CamVid データセットの 12 クラスのいずれかに属する各入力ピクセルのピクセルごとの確率です。
空
建物
電柱
道路
舗装
木
標識
柵
車両
歩行者
自転車
ラベルなし
仕様#
メトリック |
値 |
---|---|
GFlops |
260.1 |
MParams |
31.03 |
ソース・フレームワーク |
PyTorch* |
精度#
品質メトリックは CamVid 検証データセットに基づいて計算されました。ラベルのないクラスはメトリックの計算中に無視されました。
メトリック |
値 |
---|---|
mIoU |
71.95% |
IOU=TP/(TP+FN+FP)
, ここで:TP
- 指定されたクラスの真陽性ピクセルの数FN
- 指定されたクラスの偽陰性ピクセルの数FP
- 指定されたクラスの誤検知ピクセルの数
入力#
画像、形状: 1, 3, 368, 480
、形式: B, C, H, W
、ここで:
B
- バッチサイズC
- チャネルH
- 髙さW
- 幅
チャネルの順番は BGR
です
出力#
セマンティック・セグメント化クラス確率マップ、形状 - 1, 12, 368, 480
、出力データ形式 - B, C, H, W
、ここで:
B
- バッチサイズC
- [0, 1] 範囲のクラスC
に属する入力ピクセルの予測確率H
- 入力ピクセルの水平座標W
- 入力ピクセルの垂直座標
デモの使い方#
このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します:
法務上の注意書き#
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。