facial-landmarks-35-adas-0002

ユースケースと概要説明

これは、35 個の顔のランドマークを推定するカスタム・アーキテクチャーの畳み込みニューラル・ネットワークです。

例とランドマークの定義

[左目]
p0, p1: 目の隅、眼球とまぶたの境界に位置します。

[右目]
p2, p3: 目の隅、眼球とまぶたの境界に位置します。

[鼻]
p4: nose-tip ポイント、p5: 鼻中隔の最下点、p6, p7: 鼻翼の右下と左下。

[口]
p8, p9: 唇の外側の境界にある口角、p10, p11: 唇の外側の境界に沿った中心点。

[左眉毛]
p12: 眉の上の境界の始点、p13: 眉の上の円弧の中点、p14: 眉の上の境界の終点。

[右眉毛]
p15: 眉の上の境界の始点、p16: 眉の上の円弧の中点、p17: 眉の上の境界の終点。

[顔の輪郭]
p26: あごの中心、p18, p34: 顔の輪郭の上部の点が目の外側の角と一致する。
p19~p25: 曲線 p18 ~ p26 に沿って均等に分布する境界点。
p27~p33: 曲線 p26 ~ p34 に沿って均等に分布する境界点。

仕様

メトリック

GFlops

0.042

MParams

4.595

ソース・フレームワーク

Caffe*

評価データセット

異なる表情を持つ 300 人の画像を含む大規模な内部データセットの 1000 サンプルのランダムなサブセット。

検証結果

ランドマークの位置予測の品質は、標準誤差 (NE) を使用して評価されます。i 番目のサンプルのエラーの形式は次のとおりです。

ここで、N はランドマークの数、p-hat と p は、対応して、i 番目のサンプルの k 番目のランドマークの予測ベクトルとグランド・トゥルース・ベクトル、di は i 番目のサンプルの眼間距離です。

データセット

平均 NE

90 番目のパーセンタイル NE

NE の標準偏差 of NE

内部データセット

0.106

0.143

0.038

入力

画像、名前: data、形状: 1, 3, 60, 60、形式: B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル数

  • H - 画像の髙さ

  • W - 画像の幅

出力

ネットは、形状 1, 70 のブロブ align_fc3 を出力します。これには、(x0, y0, x1, y1, …, x34, y34) 形式の 35 個のランドマークの正規座標に対する 70 個の浮動小数点値の行ベクトルが含まれます。

デモの使い方

Open Model Zoo が提供する次のデモでこのモデルを使用して、その機能を確認できます。