person-vehicle-bike-detection-crossroad-yolov3-1020

ユースケースと概要説明¶

これは、セキュリティー監視アプリケーション向けに人/車両/自転車の検出用に微調整された YOLO V3 ネットワークです。さまざまなシーンや天候/照明条件で機能します。

Yolo V3 は、こちらのリポジトリーから Keras* を使用して実装され、TensorFlow* フレームワークに変換されたリアルタイム物体検出モデルです。

このモデルは、80 クラスの Common Objects in Context (COCO) データセットで事前トレーニングされ、人/車両/自転車の検出用に微調整されました。

例¶

仕様¶

メトリック	値
評価指標 (mAP)	48.89%
AP 人物	58.94%
AP 車両	62.05%
AP 自転車/バイク	25.66%
GFlops	65.98
MParams	61.92
ソース・フレームワーク	Keras*

平均精度 (AP) は、精度/再現率曲線の下の領域として定義されます。

検証データセットは、さまざまなシーンからの 34757 枚の画像で構成されており、次のものが含まれます。

オブジェクトのタイプ	境界ボックスの数
車両	229503
歩行者	240009
自転車/バイク	62643

同様に、トレーニング・データセットには次のような 17084 枚の画像があります。

オブジェクトのタイプ	境界ボックスの数
車両	121111
歩行者	119546
自転車/バイク	30220

入力¶

画像、名前: image_input、形状: 1, 416, 416, 3、形式: B, H, W, C。

説明:

B - バッチサイズ
H - 画像の髙さ
W - 画像の幅
C - チャネル数

予想される色の順序: BGR。

出力¶

検出概要情報の配列、名前: conv2d_58/Conv2D/YoloRegion、形状: 1, 255, 13, 13。anchor 値は、116,90, 156,198, 373,326 です。
検出概要情報の配列、名前: conv2d_66/Conv2D/YoloRegion、形状: 1, 255, 26, 26。anchor 値は、30,61, 62,45, 59,119 です。
検出概要情報の配列、名前: conv2d_74/Conv2D/YoloRegion、形状: 1, 255, 52, 52。anchor 値は、10,13, 16,30, 33,23 です。

各配列の出力形式は B, N*85, Cx, Cy です。
説明:

B - バッチサイズ
Cx、Cy - セル・インデックス
N - セルの検出ボックスの数

検出ボックスの形式は、[x, y, h, w, box_score, class_no_1, …, class_no_80]。

説明:

(x,y) - セルに対するボックスの中心の座標
h、w - ボックスの生の高さと幅。指数関数を適用し、対応するアンカーで乗算して、絶対的な高さと幅の値を取得します
box_score - [0, 1] 範囲の検出ボックスの信頼度
class_no_1, …, class_no_80 - [0, 1] 範囲のクラスの確率分布。信頼値 box_score を乗算して、各クラスの信頼度を取得します

モデルは人/車両/自転車検出データセットに基づいて微調整されているため、次のクラスに対してゼロ以外のスコアが返されます。

人 - 最も高いスコア
車両以外 (自転車/バイク) - 2 番目のスコア
車両 - 3 番目のスコア

これら 3 つのクラスのインデックスは、元の Common Objects in Context (COCO) データセット内のクラス person、bike、および car のインデックスと一致していることに注意してください。また、このモデルは、元の Yolo V3 との下位互換性のため、80 個の COCO クラスすべてのクラススコアを返すことにも注意してください。

デモの使い方¶

Open Model Zoo が提供する次のデモでこのモデルを使用して、その機能を確認できます。

法務上の注意書き¶

* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。

person-vehicle-bike-detection-crossroad-yolov3-1020¶

ユースケースと概要説明¶

例¶

仕様¶

入力¶

出力¶

デモの使い方¶

法務上の注意書き¶