facial-landmarks-35-adas-0002#
ユースケースと概要説明#
これは、35 個の顔のランドマークを推定するカスタム・アーキテクチャーの畳み込みニューラル・ネットワークです。
例とランドマークの定義#
[左目] p0, p1: 目の隅、眼球とまぶたの境界に位置します。
[右目] p2, p3: 目の隅、眼球とまぶたの境界に位置します。
[鼻] p4: nose-tip ポイント; p5: 鼻中隔の最下点; p6, p7: 鼻翼の右下と左下。
[口] p8, p9: 唇の外側の境界にある口角; p10, p11: 唇の外側の境界に沿った中心点。
[左眉毛] p12: 眉の上の境界の始点; p13: 眉の上の円弧の中点; p14: 眉の上の境界の終点。
[右眉毛] p15: 眉の上の境界の始点; p16: 眉の上の円弧の中点; p17: 眉の上の境界の終点。
[顔の輪郭] p26: あごの中心; p18, p34: 顔の輪郭の上部の点が目の外側の角と一致する; p19~p25: 曲線 p18 ~ p26 に沿って均等に分布する境界点; p27~p33: 曲線 p26 ~ p34 に沿って均等に分布する境界点。
仕様#
メトリック |
値 |
---|---|
GFlops |
0.042 |
MParams |
4.595 |
ソース・フレームワーク |
Caffe* |
評価データセット#
異なる表情を持つ 300 人の画像を含む大規模な内部データセットの 1000 サンプルのランダムなサブセット。
検証結果#
ランドマークの位置予測の品質は、標準誤差 (NE) を使用して評価されます。i 番目のサンプルのエラーの形式は次のとおりです:
ここで、N はランドマークの数、p-hat と p は、対応して、i 番目のサンプルの k 番目のランドマークの予測ベクトルとグラウンド・トゥルース・ベクトル、di は i 番目のサンプルの眼間距離です。
データセット |
平均 NE |
90 番目のパーセンタイル NE |
NE の標準偏差 of NE |
---|---|---|---|
内部データセット |
0.106 |
0.143 |
0.038 |
入力#
画像、名前: data
、形状: 1, 3, 60, 60
、形式: B, C, H, W
、ここで:
B
- バッチサイズC
- チャネル数H
- 画像の髙さW
- 画像の幅
出力#
ネットは、形状 1, 70
のブロブ align_fc3
を出力します。これには、(x0, y0, x1, y1, …, x34, y34) 形式の 35 個のランドマークの正規座標に対する 70 個の浮動小数点値の行ベクトルが含まれます。
デモの使い方#
このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します:
法務上の注意書き#
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。