head-pose-estimation-adas-0001#

ユースケースと概要説明#

シンプルな手作りの CNN アーキテクチャーに基づいた頭姿勢推定ネットワーク。角度回帰レイヤーは、畳み込み + ReLU + バッチノルム + 1 つの出力と完全に接続されています。

エスティメーターは、度単位で測定されたヨーピッチとロール角を出力します。次の座標系を想定します:

  • OX は顔の中心からカメラを指します

  • OY はフェースセンターから右方向を指します

  • OZ ポイントはフェースセンターから上を指します

予測された角度は、回転行列に従って顔がどのように回転されるかを示します:

Yaw - counterclockwise Pitch - counterclockwise Roll - clockwise 
    [cosY -sinY 0] [ cosP 0 sinP] [1 0 0 ] [cosY*cosP cosY*sinP*sinR-sinY*cosR cosY*sinP*cosR+sinY*sinR] 
    [sinY cosY 0] * [ 0 1 0 ] * [0 cosR sinR] = [sinY*cosP cosY*cosR-sinY*sinP*sinR sinY*sinP*cosR+cosY*sinR] 
    [ 0 0 1] [-sinP 0 cosP] [0 -sinR cosR] [ -sinP -cosP*sinR cosP*cosR ]

評価データセット#

Biwi Kinect 頭姿勢データベース

#

仕様#

メトリック

サポートされる範囲

YAW [-90,90]、PITCH [-70,70]、ROLL [-70,70]

GFlops

0.105

MParams

1.911

ソース・フレームワーク

Caffe*

精度#

アングル

平均 ± 絶対誤差の標準偏差

ヨー

5.4 ± 4.4

ピッチ

5.5 ± 5.3

ロール

4.6 ± 5.6

入力#

画像、名前: data、形状: 1, 3, 60, 60、形式: 1, C, H, W、ここで:

  • C - チャネル数

  • H - 画像の髙さ

  • W - 画像の幅

予想される色の順序は BGR です。

出力#

各出力には、テイトブライアン角度 (ヨー、ピッチ、またはロール) の値を表す 1 つの浮動小数点値が含まれます。

  1. 名前: fc_y、形状: 1, 1 - 推定ヨー (度単位)。

  2. 名前: fc_p、形状: 1, 1 - 推定ピッチ (度単位)。

  3. 名前: fc_r、形状: 1, 1 - 推定ロール (度単位)。

デモの使い方#

このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します: