icnet-camvid-ava-sparse-30-0001#

ユースケースと概要説明#

TensorFlow* フレームワークを使用して CamVid データセットで最初からトレーニングされた、高速セマンティック・セグメント化用の ICNet のトレーニング済みモデル。トレーニングされたモデルには 30% のスパース性 (すべての畳み込みカーネルの重み内のゼロの比率) があります。オリジナルの浮動小数点モデルの詳細については、高解像度画像のリアルタイムのセマンティック・セグメント化に関する ICNet を確認してください。

モデル入力は、BGR 順に 1, 720, 960, 3 の単一イメージで構成されるブロブです。ピクセル値は [0, 255] の範囲の整数です。

icnet-camvid-ava-sparse-30-0001 のモデル出力は、CamVid データセットの 12 クラスのいずれかに属する各入力ピクセルの予測クラス・インデックスです。

空
建物
電柱
道路
舗装
木
標識
柵
車両
歩行者
自転車
ラベルなし

仕様#

メトリック	値
GFlops	75.8180
MParams	26.7043
ソース・フレームワーク	TensorFlow*

精度#

品質メトリックは CamVid 検証データセットに基づいて計算されました。ラベルのないクラスはメトリックの計算中に無視されました。

メトリック	値
mIoU	75.87%

IOU=TP/(TP+FN+FP), ここで:
- TP - 指定されたクラスの真陽性ピクセルの数
- FN - 指定されたクラスの偽陰性ピクセルの数
- FP - 指定されたクラスの誤検知ピクセルの数

入力#

画像、名前: data、形状: 1, 720, 960, 3、形式: B, H, W, C、ここで:

B - バッチサイズ
H - 髙さ
W - 幅
C - チャネル

チャネルの順番は BGR です。

出力#

セマンティック・セグメント化クラス予測マップ、形状 - 1, 720, 960、出力データ形式 - B, H, W、ここで:

B - バッチサイズ
H - 入力ピクセルの水平座標
W - 入力ピクセルの垂直座標

出力には、各ピクセルのクラス予測結果が含まれます。

デモの使い方#

このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します:

法務上の注意書き#

* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。