person-vehicle-bike-detection-crossroad-0078¶
ユースケースと概要説明¶
人物/車両/自転車検出器は、SSD 検出アーキテクチャー、RMNet バックボーン、および学習可能な画像ダウンスケール・ブロック (person-vehicle-bike-detection-crossroad-0066 など、ただし追加のプーリングを備えたもの) に基づいています。このモデルはセキュリティー監視アプリケーションを目的としており、さまざまなシーンや天候/照明条件で機能します。
例¶
仕様¶
メトリック |
値 |
---|---|
評価指標 (mAP) |
65.12% |
AP 人物 |
77.47% |
AP 車両 |
74.94% |
AP 自転車 |
44.14% |
検出する最大オブジェクト |
200 |
GFlops |
3.964 |
MParams |
1.178 |
ソース・フレームワーク |
Caffe* |
平均精度 (AP) は、精度/再現率曲線の下の領域として定義されます。
検証データセットは、さまざまなシーンからの 34,757 枚の画像で構成されており、次のものが含まれます。
オブジェクトのタイプ |
境界ボックスの数 |
---|---|
車両 |
229503 |
歩行者 |
240009 |
自転車 |
62643 |
同様に、トレーニング・データセットには次のような 160,297 枚の画像があります。
オブジェクトのタイプ |
境界ボックスの数 |
---|---|
車両 |
501548 |
歩行者 |
706786 |
自転車 |
55692 |
入力¶
画像、名前: data
、形状: 1, 3, 1024, 1024
、形式: B, C, H, W
。
説明:
B
- バッチサイズC
- チャネル数H
- 画像の髙さW
- 画像の幅
予想される色の順序は BGR
です。
出力¶
最終出力は、形状: 1, 1, 200, 7
、形式: 1, 1, N, 7
のブロブです。ここで、N
は検出された境界ボックスの数です。各検出は [image_id
, label
, conf
, x_min
, y_min
, x_max
, y_max
] の形式です。
説明:
image_id
- バッチ内の画像の IDlabel
- 予測されたクラス ID (1 - 人物、2 - 車両、3 - 自転車)conf
- 予測されたクラスの信頼度(
x_min
,y_min
) - 境界ボックスの左上隅の座標(
x_max
,y_max
) - 境界ボックスの右下隅の座標
法務上の注意書き¶
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。