human-pose-estimation-0001

ユースケースと概要説明

これは、特徴抽出器として調整された MobileNet v1 を備えた複数人 2D 姿勢推定ネットワーク (OpenPose アプローチに基づく) です。画像内のすべての人物について、ネットワークはポーズ、つまりキーポイントとキーポイント間の接続で構成される体の骨格を検出します。ポーズには、ears、eyes、nose、neck、shoulders、elbows、wrists、hips、knees、ankles (耳、目、鼻、首、肩、肘、手首、腰、膝、足首) など、最大 18 個のキーポイントを含めることができます。

仕様

メトリック

平均精度 (AP)

42.8%

GFlops

15.435

MParams

4.099

ソース・フレームワーク

Caffe*

COCO キーポイント評価サイトで説明されている平均精度メトリック。

オリジナル論文パーツ・アフィニティー・フィールドを使用したリアルタイム・マルチパーソン 2D 姿勢推定から COCO 検証サブセットでテストされました。

入力

画像、名前: data、形状: 1, 3, 256, 456、形式: B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル数

  • H - 画像の髙さ

  • W - 画像の幅

予想される色の順序は BGR です。

出力

最終出力は 2 つのブロブです。

  1. 名前: Mconv7_stage2_L1、形状: 1, 38, 32, 57 - キーポイントのペア関係 (部分アフィニティー・フィールド) が含まれます。

  2. 名前: Mconv7_stage2_L2、形状: 1, 19, 32, 57 - キーポイントのヒートマップが含まれています。

デモの使い方

Open Model Zoo が提供する次のデモでこのモデルを使用して、その機能を確認できます。