landmarks-regression-retail-0009

ユースケースと概要説明

これは、スマート・クラスルーム・シナリオ用の軽量のランドマーク・リグレッサーです。スタックされた 3x3 畳み込み、バッチ正規化、PReLU アクティベーション、およびプーリングといった古典的な畳み込みの設計が採用されています。最終的な回帰は、グローバルな深さ方向のプーリングヘッドと FullyConnected レイヤーによって実行されます。このモデルは、2 つの目、鼻、2 つの口角の 5 つの顔のランドマークを予測します。

仕様

メトリック

平均正規誤差 (VGGFace2 で)

0.0705

顔の位置要件

タイトなクロップ

GFlops

0.021

MParams

0.191

ソース・フレームワーク

PyTorch*

i 番目のサンプルの正規誤差 (NE) は次の形式になります。

ここで、N はランドマークの数、p-hat と p は、対応して、i 番目のサンプルの k 番目のランドマークの予測ベクトルとグランド・トゥルース・ベクトル、di は i 番目のサンプルの眼間距離です。

入力

画像、名前: 0、形状: 1, 3, 48, 48、形式: B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル数

  • H - 画像の髙さ

  • W - 画像の幅

予想される色の順序は BGR です。

出力

ネットは、形状 1, 10, 1, 1 のブロブを出力します。これには、形式 (x0、y0、x1、y1、…、x4、y4) の 5 つのランドマーク座標に対する 10 個の浮動小数点値の行ベクトルが含まれます。すべての座標は範囲 [0, 1] 内に収まるように正規化されます。

デモの使い方

Open Model Zoo が提供する次のデモでこのモデルを使用して、その機能を確認できます。