person-detection-action-recognition-0005

ユースケースと概要説明

これは、スマート・クラスルーム・シナリオのアクション検出器です。これは、3x3 畳み込みブロックの計算量を削減する深さ方向の畳み込みを含む RMNet バックボーンに基づいています。1/16 スケールの特徴マップからの最初の SSD ヘッドには、4 つのクラスター化された事前ボックスがあり、検出された人物 (2 クラス検出器) を出力します。2 番目の SSD ベースのヘッドは、検出された人物の行動を予測します。
考えられる行動: 座る、立つ、手を上げる

仕様

メトリック

Detector AP (内部テストセット 2)

80.0%

精度 (内部テストセット 2)

83.8%

ポーズカバレッジ

座る、立つ、手を上げる

隠れた歩行者のサポート

オクルージョン・カバレッジ

<50%

歩行者の最低身長

80 ピクセル (1080p)

GFlops

7.140

MParams

1.951

ソース・フレームワーク

Caffe*

平均精度 (AP) は、精度/再現率曲線の下の領域として定義されます。

入力

画像、名前: data、形状: 1, 3, 400, 680、形式: B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル数

  • H - 画像の髙さ

  • W - 画像の幅

予想される色の順序は BGR です。

出力

最終出力は 4 つのブランチです。

  1. 名前: mbox_loc1/out/conv/flat、形状: b, num_priors*4 - SSD 形式のボックス座標

  2. 名前: mbox_main_conf/out/conv/flat/softmax/flat、形状: b, num_priors*2 - 検出の信頼度

  3. 名前: mbox/priorbox、形状: 1, 2, num_priors*4 - SSD フォーマットの以前のボックス

  4. 名前: out/anchor1、形状: b, h, w, 3 - アクションの信頼度

  5. 名前: out/anchor2、形状: b, h, w, 3 - アクションの信頼度

  6. 名前: out/anchor3、形状: b, h, w, 3 - アクションの信頼度

  7. 名前: out/anchor4、形状: b, h, w, 3 - アクションの信頼度

説明:

  • b - バッチサイズ

  • num_priors - SSD 形式の前の件数 (25x43x4=4300 に相当)

  • h, w - 出力特徴マップの高さと幅 (h=25、w=43)

デモの使い方

Open Model Zoo が提供する次のデモでこのモデルを使用して、その機能を確認できます。