person-vehicle-bike-detection-2004#

ユースケースと概要説明#

これは、解像度 448x256 の ATSS ヘッドを備えた MobileNetV2 バックボーンに基づく人物、車両、自転車の検出器です。

#

仕様#

メトリック

AP @ [ IoU=0.50:0.95 ]

0.274 (内部テストセット)

GFlops

1.811

MParams

2.327

ソース・フレームワーク

PyTorch*

平均精度 (AP) は、精度/再現率曲線の下の領域として定義されます。

入力#

画像、名前: image、形状: 1, 3, 256, 448、形式: B, C, H, W、ここで:

  • B - バッチサイズ

  • C - チャネル数

  • H - 画像の髙さ

  • W - 画像の幅

予想される色の順序は BGR です。

出力#

  1. boxes は、形状 100, 5、形式 N, 5 のブロブです。ここで N は検出された境界ボックスの数です。各検出の説明は [x_min, y_min, x_max, y_max, conf] の形式です。ここで:

    • (x_min, y_min) - 境界ボックスの左上隅の座標

    • (x_max, y_max) - 境界ボックスの右下隅の座標

    • conf - 予測されたクラスの信頼度

  2. labels は、形状 100、形式 N のブロブです。ここで N は検出された境界ボックスの数です。各ラベルの値は予測されたクラス ID と同じです (0 - 車両、1 - 人物、2 - 非車両)

トレーニング・パイプライン#

OpenVINO トレーニング拡張は、トレーニング・パイプラインを提供し、カスタム・データセットでモデルを微調整できるようにします。

デモの使い方#

このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します: