semantic-segmentation-adas-0001#
ユースケースと概要説明#
これは、各ピクセルを 20 のクラスに分類するセグメント化ネットワークです:
道路
歩道
建物
壁
柵
電柱
信号機
標識
植生
地形
空
人物
ライダー
乗用車
トラック
バス
電車
オートバイ
自転車
車両以外
例#
仕様#
メトリック |
値 |
---|---|
画像サイズ |
2048x1024 |
GFlops |
58.572 |
MParams |
6.686 |
ソース・フレームワーク |
Caffe* |
精度#
2000 枚の画像で計算された品質指標:
ラベル |
IOU |
---|---|
平均 |
0.6907 |
道路 |
0.910379 |
歩道 |
0.630676 |
建物 |
0.860139 |
壁 |
0.424166 |
柵 |
0.592632 |
電柱 |
0.559078 |
信号機 |
0.654779 |
標識 |
0.648217 |
植生 |
0.882593 |
地形 |
0.620521 |
空 |
0.976889 |
人物 |
0.711653 |
ライダー |
0.612787 |
乗用車 |
0.877892 |
トラック |
0.674829 |
バス |
0.743752 |
電車 |
0.358641 |
オートバイ |
0.600701 |
自転車 |
0.622246 |
車両以外 |
0.852932 |
IOU=TP/(TP+FN+FP)
, ここで:TP
- 指定されたクラスの真陽性ピクセルの数FN
- 指定されたクラスの偽陰性ピクセルの数FP
- 指定されたクラスの誤検知ピクセルの数
入力#
BGR
イメージと B, C, H, W
形式の形状 1, 3, 1024, 2048
を含むブロブです。ここで:
B
– バッチサイズC
– チャネル数H
– 画像の髙さW
– 画像の幅
出力#
最終出力は、B, C, H, W
形式の 1, 1, 1024, 2048
の形状を持つ BLOB です。これは、各ピクセルがいずれかのクラスのラベルである 1 チャネルの特徴マップとして扱うことができます。
デモの使い方#
このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します:
法務上の注意書き#
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。