head-pose-estimation-adas-0001

ユースケースと概要説明

シンプルな手作りの CNN アーキテクチャーに基づいた頭姿勢推定ネットワーク。角度回帰レイヤーは、畳み込み + ReLU + バッチノルム + 1 つの出力と完全に接続されています。

エスティメーターは、度単位で測定されたヨーピッチとロール角を出力します。次の座標系を想定します。

  • OX は顔の中心からカメラを指します

  • OY はフェースセンターから右方向を指すします

  • OZ ポイントはフェースセンターから上を指すします

予測された角度は、回転行列に従って顔がどのように回転されるかを示します。

Yaw - counterclockwise Pitch - counterclockwise Roll - clockwise
    [cosY -sinY 0]          [ cosP 0 sinP]       [1    0    0 ]   [cosY*cosP cosY*sinP*sinR-sinY*cosR cosY*sinP*cosR+sinY*sinR]
    [sinY  cosY 0]    *     [  0   1  0  ]   *   [0  cosR sinR] = [sinY*cosP cosY*cosR-sinY*sinP*sinR sinY*sinP*cosR+cosY*sinR]
    [  0    0   1]          [-sinP 0 cosP]       [0 -sinR cosR]   [  -sinP          -cosP*sinR                cosP*cosR       ]

仕様

メトリック

サポートされる範囲

YAW [-90,90]、PITCH [-70,70]、ROLL [-70,70]

GFlops

0.105

MParams

1.911

ソース・フレームワーク

Caffe*

精度

アングル

平均 ± 絶対誤差の標準偏差

ヨー

5.4 ± 4.4

ピッチ

5.5 ± 5.3

ロール

4.6 ± 5.6

入力

画像、名前: data、形状: 1, 3, 60, 60、形式: 1, C, H, W

説明:

  • C - チャネル数

  • H - 画像の髙さ

  • W - 画像の幅

予想される色の順序は BGR です。

出力

各出力には、テイトブライアン角度 (ヨー、ピッチ、またはロール) の値を表す 1 つの浮動小数点値が含まれます。

  1. 名前: fc_y、形状: 1, 1 - 推定ヨー (度単位)。

  2. 名前: fc_p、形状: 1, 1 - 推定ピッチ (度単位)。

  3. 名前: fc_r、形状: 1, 1 - 推定ロール (度単位)。

デモの使い方

Open Model Zoo が提供する次のデモでこのモデルを使用して、その機能を確認できます。