face-detection-0200#

ユースケースと概要説明#

バックボーンとして MobileNetV2 に基づいた顔検出器。前面カメラで撮影された屋内および屋外シーン用の複数 SSD ヘッドを備えています。モデルのトレーニング中に、トレーニング画像のサイズが 256x256 に変更されました。

#

仕様#

メトリック

AP (WIDER)

86.74%

GFlops

0.786

MParams

1.828

ソース・フレームワーク

PyTorch*

平均精度 (AP) は、精度/再現率曲線の下の領域として定義されます。すべての数値は、64 x 64 ピクセルより大きい顔のみを考慮して評価されました。

入力#

画像、名前: image、形状: 1, 3, 256, 256、形式: B, C, H, W、ここで:

  • B - バッチサイズ

  • C - チャネル数

  • H - 画像の髙さ

  • W - 画像の幅

予想される色の順序: BGR

出力#

最終出力は、形状: 1, 1, 200, 7、形式: 1, 1, N, 7 のブロブです。ここで、N は検出された境界ボックスの数です。各検出は [image_id, label, conf, x_min, y_min, x_max, y_max] の形式です。ここで:

  • image_id - バッチ内の画像の ID

  • label - 予測されたクラス ID (0 - 顔)

  • conf - 予測されたクラスの信頼度

  • (x_min, y_min) - 境界ボックスの左上隅の座標

  • (x_max, y_max) - 境界ボックスの右下隅の座標

トレーニング・パイプライン#

OpenVINO トレーニング拡張は、トレーニング・パイプラインを提供し、カスタム・データセットでモデルを微調整できるようにします。

デモの使い方#

このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します: