person-vehicle-bike-detection-crossroad-1016#

ユースケースと概要説明#

MobileNetV2 + SSD ベースのネットワークは、セキュリティー監視アプリケーションにおける人/車両/自転車の検出に使用されます。さまざまなシーンや天候/照明条件で機能します。

例#

仕様#

メトリック	値
評価指標 (mAP)	62.55%
AP 人物	73.63%
AP 車両	77.84%
AP 自転車	36.18%
検出する最大オブジェクト	200
GFlops	3.560
ソース・フレームワーク	PyTorch*

平均精度 (AP) は、精度/再現率曲線の下の領域として定義されます。

検証データセットは、さまざまなシーンからの 34,757 枚の画像で構成されており、次のものが含まれます:

オブジェクトのタイプ	境界ボックスの数
車両	229,503
歩行者	240,009
非車両	62,643

同様に、トレーニング・データセットには次のような 219,181 枚の画像があります:

オブジェクトのタイプ	境界ボックスの数
車両	810,323
歩行者	1,114,799
非車両	62,334

入力#

画像、名前: input.1、形状: 1, 3, 512, 512、形式: B, C, H, W、ここで:

B - バッチサイズ
C - チャネル数
H - 画像の髙さ
W - 画像の幅

予想される色の順序: BGR。

出力#

最終出力は、形状: 1, 1, 200, 7、形式: 1, 1, N, 7 のブロブです。ここで、N は検出された境界ボックスの数です。各検出は [image_id, label, conf, x_min, y_min, x_max, y_max] の形式です。ここで:

image_id - バッチ内の画像の ID
label - 予測されたクラス ID (0 - 非車両、1 - 車両、2 - 人物)
conf - 予測されたクラスの信頼度
(x_min, y_min) - 境界ボックスの左上隅の座標
(x_max, y_max) - 境界ボックスの右下隅の座標

デモの使い方#

このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します:

法務上の注意書き#

* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。