person-vehicle-bike-detection-crossroad-0078

ユースケースと概要説明

人物/車両/自転車検出器は、SSD 検出アーキテクチャー、RMNet バックボーン、および学習可能な画像ダウンスケール・ブロック (person-vehicle-bike-detection-crossroad-0066 など、ただし追加のプーリングを備えたもの) に基づいています。このモデルはセキュリティー監視アプリケーションを目的としており、さまざまなシーンや天候/照明条件で機能します。

仕様

メトリック

評価指標 (mAP)

65.12%

AP 人物

77.47%

AP 車両

74.94%

AP 自転車

44.14%

検出する最大オブジェクト

200

GFlops

3.964

MParams

1.178

ソース・フレームワーク

Caffe*

平均精度 (AP) は、精度/再現率曲線の下の領域として定義されます。

検証データセットは、さまざまなシーンからの 34,757 枚の画像で構成されており、次のものが含まれます。

オブジェクトのタイプ

境界ボックスの数

車両

229503

歩行者

240009

自転車

62643

同様に、トレーニング・データセットには次のような 160,297 枚の画像があります。

オブジェクトのタイプ

境界ボックスの数

車両

501548

歩行者

706786

自転車

55692

入力

画像、名前: data、形状: 1, 3, 1024, 1024、形式: B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル数

  • H - 画像の髙さ

  • W - 画像の幅

予想される色の順序は BGR です。

出力

最終出力は、形状: 1, 1, 200, 7、形式: 1, 1, N, 7 のブロブです。ここで、N は検出された境界ボックスの数です。各検出は [image_id, label, conf, x_min, y_min, x_max, y_max] の形式です。
説明:

  • image_id - バッチ内の画像の ID

  • label - 予測されたクラス ID (1 - 人物、2 - 車両、3 - 自転車)

  • conf - 予測されたクラスの信頼度

  • (x_min, y_min) - 境界ボックスの左上隅の座標

  • (x_max, y_max) - 境界ボックスの右下隅の座標

デモの使い方

Open Model Zoo が提供する次のデモでこのモデルを使用して、その機能を確認できます。