icnet-camvid-ava-sparse-30-0001¶
ユースケースと概要説明¶
TensorFlow* フレームワークを使用して CamVid データセットで最初からトレーニングされた、高速セマンティック・セグメント化用の ICNet のトレーニング済みモデル。トレーニングされたモデルには 30% のスパース性 (すべての畳み込みカーネルの重み内のゼロの比率) があります。オリジナルの浮動小数点モデルの詳細については、高解像度画像のリアルタイムのセマンティック・セグメント化に関する ICNet を確認してください。
モデル入力は、BGR
順に 1, 720, 960, 3
の単一イメージで構成されるブロブです。ピクセル値は [0, 255] の範囲の整数です。
icnet-camvid-ava-sparse-30-0001
のモデル出力は、CamVid データセットの 12 クラスのいずれかに属する各入力ピクセルの予測クラス・インデックスです。
空
ビルド
電柱
Road
舗装
木
標識
柵
車両
歩行者
自転車
ラベルなし
仕様¶
メトリック |
値 |
---|---|
GFlops |
75.8180 |
MParams |
26.7043 |
ソース・フレームワーク |
TensorFlow* |
精度¶
品質メトリックは CamVid 検証データセットに基づいて計算されました。unlabeled
クラスはメトリックの計算中に無視されました。
メトリック |
値 |
---|---|
mIoU |
75.87% |
-
IOU=TP/(TP+FN+FP)
。説明:
TP
- 指定されたクラスの真陽性ピクセルの数FN
- 指定されたクラスの偽陰性ピクセルの数FP
- 指定されたクラスの誤検知ピクセルの数
入力¶
画像、名前: data
、形状: 1, 720, 960, 3
、形式: B, H, W, C
。
説明:
B
- バッチサイズH
- 高さW
- 幅C
- チャネル
チャネルの順番は BGR
です。
出力¶
セマンティック・セグメント化クラス予測マップ、形状 - 1, 720, 960
、出力データ形式 - B, H, W
。
説明:
B
- バッチサイズH
- 入力ピクセルの水平座標W
- 入力ピクセルの垂直座標
出力には、各ピクセルのクラス予測結果が含まれます。
法務上の注意書き¶
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。