landmarks-regression-retail-0009#

ユースケースと概要説明#

これは、スマート・クラスルーム・シナリオ用の軽量のランドマーク・リグレッサーです。スタックされた 3x3 畳み込み、バッチ正規化、PReLU 活性化、およびプーリングといった古典的な畳み込みの設計が採用されています。最終的な回帰は、グローバルな深さ方向のプーリングヘッドと FullyConnected レイヤーによって実行されます。このモデルは、2 つの目、鼻、2 つの口角の 5 つの顔のランドマークを予測します。

例#

仕様#

メトリック	値
平均正規誤差 (VGGFace2 で)	0.0705
顔の位置要件	タイトなクロップ
GFlops	0.021
MParams	0.191
ソース・フレームワーク	PyTorch*

i 番目のサンプルの正規誤差 (NE) は次の形式になります:

ここで、N はランドマークの数、p-hat と p は、対応して、i 番目のサンプルの k 番目のランドマークの予測ベクトルとグラウンド・トゥルース・ベクトル、d_i は i 番目のサンプルの眼間距離です。

入力#

画像、名前: 0、形状: 1, 3, 48, 48、形式: B, C, H, W、ここで:

B - バッチサイズ
C - チャネル数
H - 画像の髙さ
W - 画像の幅

予想される色の順序は BGR です。

出力#

ネットは、形状 1, 10, 1, 1 のブロブを出力します。これには、形式 (x0、y0、x1、y1、…、x4、y4) の 5 つのランドマーク座標に対する 10 個の浮動小数点値の行ベクトルが含まれます。すべての座標は範囲 [0, 1] 内に収まるように正規化されます。

デモの使い方#

このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します:

法務上の注意書き#

* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。