head-pose-estimation-adas-0001#
ユースケースと概要説明#
シンプルな手作りの CNN アーキテクチャーに基づいた頭姿勢推定ネットワーク。角度回帰レイヤーは、畳み込み + ReLU + バッチノルム + 1 つの出力と完全に接続されています。
エスティメーターは、度単位で測定されたヨーピッチとロール角を出力します。次の座標系を想定します:
OX は顔の中心からカメラを指します
OY はフェースセンターから右方向を指します
OZ ポイントはフェースセンターから上を指します
予測された角度は、回転行列に従って顔がどのように回転されるかを示します:
Yaw - counterclockwise Pitch - counterclockwise Roll - clockwise
[cosY -sinY 0] [ cosP 0 sinP] [1 0 0 ] [cosY*cosP cosY*sinP*sinR-sinY*cosR cosY*sinP*cosR+sinY*sinR]
[sinY cosY 0] * [ 0 1 0 ] * [0 cosR sinR] = [sinY*cosP cosY*cosR-sinY*sinP*sinR sinY*sinP*cosR+cosY*sinR]
[ 0 0 1] [-sinP 0 cosP] [0 -sinR cosR] [ -sinP -cosP*sinR cosP*cosR ]
評価データセット#
例#
仕様#
メトリック |
値 |
---|---|
サポートされる範囲 |
YAW [-90,90]、PITCH [-70,70]、ROLL [-70,70] |
GFlops |
0.105 |
MParams |
1.911 |
ソース・フレームワーク |
Caffe* |
精度#
アングル |
|
---|---|
ヨー |
5.4 ± 4.4 |
ピッチ |
5.5 ± 5.3 |
ロール |
4.6 ± 5.6 |
入力#
画像、名前: data
、形状: 1, 3, 60, 60
、形式: 1, C, H, W
、ここで:
C
- チャネル数H
- 画像の髙さW
- 画像の幅
予想される色の順序は BGR
です。
出力#
各出力には、テイトブライアン角度 (ヨー、ピッチ、またはロール) の値を表す 1 つの浮動小数点値が含まれます。
名前:
fc_y
、形状:1, 1
- 推定ヨー (度単位)。名前:
fc_p
、形状:1, 1
- 推定ピッチ (度単位)。名前:
fc_r
、形状:1, 1
- 推定ロール (度単位)。
デモの使い方#
このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します:
法務上の注意書き#
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。