person-vehicle-bike-detection-2002

ユースケースと概要説明

これは、1/16 および 1/8 スケールの特徴マップからの 2 つの SSD ヘッドと、解像度 512x512 のクラスター化された以前のボックスを備えた MobileNetV2 バックボーンに基づく人物、車両、自転車の検出器です。

仕様

メトリック

AP @ [ IoU=0.50:0.95 ]

0.2459 (内部テストセット)

GFlops

3.146

MParams

1.821

ソース・フレームワーク

PyTorch*

入力

画像、名前: image、形状: 1, 3, 512, 512、形式: B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル数

  • H - 画像の髙さ

  • W - 画像の幅

予想される色の順序は BGR です。

出力

最終出力は、形状: 1, 1, 200, 7、形式: 1, 1, N, 7 のブロブです。ここで、N は検出された境界ボックスの数です。各検出は [image_id, label, conf, x_min, y_min, x_max, y_max] の形式です。
説明:

  • image_id - バッチ内の画像の ID

  • label - 予測されたクラス ID (0 - 車両、1 - 人物、2 - 自転車)

  • conf - 予測されたクラスの信頼度

  • (x_min, y_min) - 境界ボックスの左上隅の座標

  • (x_max, y_max) - 境界ボックスの右下隅の座標

トレーニング・パイプライン

OpenVINO トレーニング拡張は、トレーニング・パイプラインを提供し、カスタム・データセットでモデルを微調整できるようにします。

デモの使い方

Open Model Zoo が提供する次のデモでこのモデルを使用して、その機能を確認できます。