face-detection-0206#

ユースケースと概要説明#

バックボーンとして ResNet152 に基づいた顔検出器。前面カメラで撮影された屋内および屋外シーン用の ATSS ヘッドを備えています。

平均精度 (AP) は、精度/再現率曲線の下の領域として定義されます。すべての数値は、64 x 64 ピクセルより大きい顔のみを考慮して評価されました。

画像、名前: image、形状: 1, 3, 640, 640、形式: B, C, H, W、ここで:

予想される色の順序: BGR。

boxes は、形状 750, 5、形式 N, 5 のブロブです。ここで N は検出された境界ボックスの数です。各検出の形式は次のとおりです: [x_min, y_min, x_max, y_max, conf]、ここで:
- (x_min, y_min) - 境界ボックスの左上隅の座標
- (x_max, y_max) - 境界ボックスの右下隅の座標
- conf - 予測されたクラスの信頼度
labels は、形状 750、形式 N のブロブです。ここで N は検出された境界ボックスの数です。これには、検出された各ボックスごとの予測クラス ID (0 - 顔) が含まれます。

OpenVINO トレーニング拡張は、トレーニング・パイプラインを提供し、カスタム・データセットでモデルを微調整できるようにします。

このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します:

* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。