icnet-camvid-ava-sparse-30-0001

ユースケースと概要説明

TensorFlow* フレームワークを使用して CamVid データセットで最初からトレーニングされた、高速セマンティック・セグメント化用の ICNet のトレーニング済みモデル。トレーニングされたモデルには 30% のスパース性 (すべての畳み込みカーネルの重み内のゼロの比率) があります。オリジナルの浮動小数点モデルの詳細については、高解像度画像のリアルタイムのセマンティック・セグメント化に関する ICNet を確認してください。

モデル入力は、BGR 順に 1, 720, 960, 3 の単一イメージで構成されるブロブです。ピクセル値は [0, 255] の範囲の整数です。

icnet-camvid-ava-sparse-30-0001 のモデル出力は、CamVid データセットの 12 クラスのいずれかに属する各入力ピクセルの予測クラス・インデックスです。

  • ビルド

  • 電柱

  • Road

  • 舗装

  • 標識

  • 車両

  • 歩行者

  • 自転車

  • ラベルなし

仕様

メトリック

GFlops

75.8180

MParams

26.7043

ソース・フレームワーク

TensorFlow*

精度

品質メトリックは CamVid 検証データセットに基づいて計算されました。unlabeled クラスはメトリックの計算中に無視されました。

メトリック

mIoU

75.87%

  • IOU=TP/(TP+FN+FP)

    説明:

    • TP - 指定されたクラスの真陽性ピクセルの数

    • FN - 指定されたクラスの偽陰性ピクセルの数

    • FP - 指定されたクラスの誤検知ピクセルの数

入力

画像、名前: data、形状: 1, 720, 960, 3、形式: B, H, W, C

説明:

  • B - バッチサイズ

  • H - 高さ

  • W - 幅

  • C - チャネル

チャネルの順番は BGR です。

出力

セマンティック・セグメント化クラス予測マップ、形状 - 1, 720, 960、出力データ形式 - B, H, W

説明:

  • B - バッチサイズ

  • H - 入力ピクセルの水平座標

  • W - 入力ピクセルの垂直座標

出力には、各ピクセルのクラス予測結果が含まれます。

デモの使い方

Open Model Zoo が提供する次のデモでこのモデルを使用して、その機能を確認できます。