person-detection-retail-0002#

ユースケースと概要説明#

小売シナリオ向けのハイパー機能 + R-FCN を備えたバックボーンに基づく歩行者検知器です。

#

仕様#

メトリック

AP

80.14%

ポーズカバレッジ

直立、画像面と平行

隠れた歩行者のサポート

はい

オクルージョン・カバレッジ

<50%

歩行者の最低身長

80 ピクセル (1080p)

検出する最大オブジェクト

200

GFlops

12.427

MParams

3.244

ソース・フレームワーク

Caffe*

平均精度 (AP) は、精度/再現率曲線の下の領域として定義されます。検証データセットは、約 100 の異なるシーンからの約 50K の画像で構成されています。

入力#

  1. 画像、名前: data、形状: 1, 3, 544, 992、形式: 1, C, H, W、ここで:

    • C - チャネル数

    • H - 画像の髙さ

    • W - 画像の幅

    予想されるチャネルの順序は BGR です。

  2. 名前: im_info、形状: 1, 6 - 画像情報: [544, 992, 992/frame_width, 544/frame_height, 992/frame_width, 544/frame_height]

出力#

最終出力は、形状: 1, 1, 200, 7、形式: 1, 1, N, 7 のブロブです。ここで、N は検出された境界ボックスの数です。各検出は [image_id, label, conf, x_min, y_min, x_max, y_max] の形式です。ここで:

  • image_id - バッチ内の画像の ID

  • label - 予測されたクラス ID (1 - 人物)

  • conf - 予測されたクラスの信頼度

  • (x_min, y_min) - 境界ボックスの左上隅の座標

  • (x_max, y_max) - 境界ボックスの右下隅の座標

デモの使い方#

このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します: