facial-landmarks-35-adas-0002#

ユースケースと概要説明#

これは、35 個の顔のランドマークを推定するカスタム・アーキテクチャーの畳み込みニューラル・ネットワークです。

例とランドマークの定義#

[左目] p0, p1: 目の隅、眼球とまぶたの境界に位置します。

[右目] p2, p3: 目の隅、眼球とまぶたの境界に位置します。

[鼻] p4: nose-tip ポイント; p5: 鼻中隔の最下点; p6, p7: 鼻翼の右下と左下。

[口] p8, p9: 唇の外側の境界にある口角; p10, p11: 唇の外側の境界に沿った中心点。

[左眉毛] p12: 眉の上の境界の始点; p13: 眉の上の円弧の中点; p14: 眉の上の境界の終点。

[右眉毛] p15: 眉の上の境界の始点; p16: 眉の上の円弧の中点; p17: 眉の上の境界の終点。

[顔の輪郭] p26: あごの中心; p18, p34: 顔の輪郭の上部の点が目の外側の角と一致する; p19~p25: 曲線 p18 ~ p26 に沿って均等に分布する境界点; p27~p33: 曲線 p26 ~ p34 に沿って均等に分布する境界点。

仕様#

メトリック

GFlops

0.042

MParams

4.595

ソース・フレームワーク

Caffe*

評価データセット#

異なる表情を持つ 300 人の画像を含む大規模な内部データセットの 1000 サンプルのランダムなサブセット。

検証結果#

ランドマークの位置予測の品質は、標準誤差 (NE) を使用して評価されます。i 番目のサンプルのエラーの形式は次のとおりです:

ここで、N はランドマークの数、p-hat と p は、対応して、i 番目のサンプルの k 番目のランドマークの予測ベクトルとグラウンド・トゥルース・ベクトル、di は i 番目のサンプルの眼間距離です。

データセット

平均 NE

90 番目のパーセンタイル NE

NE の標準偏差 of NE

内部データセット

0.106

0.143

0.038

入力#

画像、名前: data、形状: 1, 3, 60, 60、形式: B, C, H, W、ここで:

  • B - バッチサイズ

  • C - チャネル数

  • H - 画像の髙さ

  • W - 画像の幅

出力#

ネットは、形状 1, 70 のブロブ align_fc3 を出力します。これには、(x0, y0, x1, y1, …, x34, y34) 形式の 35 個のランドマークの正規座標に対する 70 個の浮動小数点値の行ベクトルが含まれます。

デモの使い方#

このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します: