person-detection-action-recognition-teacher-0002#

ユースケースと概要説明#

これは、スマート・クラスルーム・シナリオのアクション検出器です。これは、3x3 畳み込みブロックの計算量を削減する深さ方向の畳み込みを含む RMNet バックボーンに基づいています。1/16 スケールの特徴マップからの最初の SSD ヘッドには、4 つのクラスター化された事前ボックスがあり、検出された人物 (2 クラス検出器) を出力します。2 番目の SSD ベースのヘッドは、検出された人物の行動を予測します。考えられる行動: 立つ、書く、デモンストレーションする。

例#

仕様#

メトリック	値
Detector AP (内部テストセット 2)	80.0%
精度 (内部テストセット 1)	72.4%
ポーズカバレッジ	立っ、書く、デモンストレーションする
隠れた歩行者のサポート	はい
オクルージョン・カバレッジ	<50%
歩行者の最低身長	80 ピクセル (1080p)
GFlops	7.140
MParams	1.951
ソース・フレームワーク	Caffe*

平均精度 (AP) は、精度/再現率曲線の下の領域として定義されます。

入力#

画像、名前: data、形状: 1, 3, 400, 680、形式: B, C, H, W、ここで:

B - バッチサイズ
C - チャネル数
H - 画像の髙さ
W - 画像の幅

予想される色の順序は BGR です。

出力#

最終出力は 4 つのブランチです:

名前: mbox_loc1/out/conv/flat、形状: b, num_priors*4 - SSD 形式のボックス座標。
名前: mbox_main_conf/out/conv/flat/softmax/flat、形状: b, num_priors*2 - 検出の信頼度
名前: mbox/priorbox、形状: 1, 2, num_priors*4 - SSD フォーマットの以前のボックス
名前: out/anchor1、形状: b, h, w, 3 - アクションの信頼度
名前: out/anchor2、形状: b, h, w, 3 - アクションの信頼度
名前: out/anchor3、形状: b, h, w, 3 - アクションの信頼度
名前: out/anchor4、形状: b, h, w, 3 - アクションの信頼度

説明:

b - バッチサイズ
num_priors - SSD 形式の前の件数 (25x43x4=4300 に相当)
h, w - 出力特徴マップの高さと幅 (h=25、w=43)

デモの使い方#

このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します:

法務上の注意書き#

* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。