landmarks-regression-retail-0009¶
ユースケースと概要説明¶
これは、スマート・クラスルーム・シナリオ用の軽量のランドマーク・リグレッサーです。スタックされた 3x3 畳み込み、バッチ正規化、PReLU アクティベーション、およびプーリングといった古典的な畳み込みの設計が採用されています。最終的な回帰は、グローバルな深さ方向のプーリングヘッドと FullyConnected レイヤーによって実行されます。このモデルは、2 つの目、鼻、2 つの口角の 5 つの顔のランドマークを予測します。
例¶
仕様¶
メトリック |
値 |
---|---|
平均正規誤差 (VGGFace2 で) |
0.0705 |
顔の位置要件 |
タイトなクロップ |
GFlops |
0.021 |
MParams |
0.191 |
ソース・フレームワーク |
PyTorch* |
i 番目のサンプルの正規誤差 (NE) は次の形式になります。
ここで、N はランドマークの数、p-hat と p は、対応して、i 番目のサンプルの k 番目のランドマークの予測ベクトルとグランド・トゥルース・ベクトル、di は i 番目のサンプルの眼間距離です。
入力¶
画像、名前: 0
、形状: 1, 3, 48, 48
、形式: B, C, H, W
。
説明:
B
- バッチサイズC
- チャネル数H
- 画像の髙さW
- 画像の幅
予想される色の順序は BGR
です。
出力¶
ネットは、形状 1, 10, 1, 1
のブロブを出力します。これには、形式 (x0、y0、x1、y1、…、x4、y4) の 5 つのランドマーク座標に対する 10 個の浮動小数点値の行ベクトルが含まれます。すべての座標は範囲 [0, 1] 内に収まるように正規化されます。
デモの使い方¶
Open Model Zoo が提供する次のデモでこのモデルを使用して、その機能を確認できます。
法務上の注意書き¶
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。