person-vehicle-bike-detection-2001¶
ユースケースと概要説明¶
これは、1/16 および 1/8 スケールの特徴マップからの 2 つの SSD ヘッドと、解像度 384x384 のクラスター化された以前のボックスを備えた MobileNetV2 バックボーンに基づく人物、車両、自転車の検出器です。
例¶
仕様¶
メトリック |
値 |
---|---|
AP @ [ IoU=0.50:0.95 ] |
0.2259 (内部テストセット) |
GFlops |
1.770 |
MParams |
1.821 |
ソース・フレームワーク |
PyTorch* |
平均精度 (AP) は、精度/再現率曲線の下の領域として定義されます。
入力¶
画像、名前: image
、形状: 1, 3, 384, 384
、形式: B, C, H, W
。
説明:
B
- バッチサイズC
- チャネル数H
- 画像の髙さW
- 画像の幅
予想される色の順序は BGR
です。
出力¶
最終出力は、形状: 1, 1, 200, 7
、形式: 1, 1, N, 7
のブロブです。ここで、N
は検出された境界ボックスの数です。各検出は [image_id
, label
, conf
, x_min
, y_min
, x_max
, y_max
] の形式です。
説明:
image_id
- バッチ内の画像の IDlabel
- 予測されたクラス ID (0 - 車両、1 - 人物、2 - 自転車)conf
- 予測されたクラスの信頼度(
x_min
,y_min
) - 境界ボックスの左上隅の座標(
x_max
,y_max
) - 境界ボックスの右下隅の座標
トレーニング・パイプライン¶
OpenVINO トレーニング拡張は、トレーニング・パイプラインを提供し、カスタム・データセットでモデルを微調整できるようにします。
デモの使い方¶
Open Model Zoo が提供する次のデモでこのモデルを使用して、その機能を確認できます。
法務上の注意書き¶
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。