face-detection-0206¶
ユースケースと概要説明¶
バックボーンとして ResNet152 に基づいた顔検出器。前面カメラで撮影された屋内および屋外シーン用の ATSS ヘッドを備えています。
例¶
仕様¶
メトリック |
値 |
---|---|
AP (WIDER) |
94.27% |
GFlops |
339.602 |
MParams |
69.920 |
ソース・フレームワーク |
PyTorch* |
平均精度 (AP) は、精度/再現率曲線の下の領域として定義されます。すべての数値は、64 x 64 ピクセルより大きい顔のみを考慮して評価されました。
入力¶
画像、名前: image
、形状: 1, 3, 640, 640
、形式: B, C, H, W
。
説明:
B
- バッチサイズC
- チャネル数H
- 画像の髙さW
- 画像の幅
予想される色の順序: BGR
。
出力¶
-
boxes
は、形状750, 5
、形式N, 5
のブロブです。ここでN
は検出された境界ボックスの数です。各検出の形式は次のとおりです。
[x_min
,y_min
,x_max
,y_max
,conf
]説明:
(
x_min
,y_min
) - 境界ボックスの左上隅の座標(
x_max
,y_max
) - 境界ボックスの右下隅の座標conf
- 予測されたクラスの信頼度
labels
は、形状750
、形式N
のブロブです。ここでN
は検出された境界ボックスの数です。これには、検出された各ボックスごとの予測クラス ID (0 - 顔) が含まれます。
トレーニング・パイプライン¶
OpenVINO トレーニング拡張は、トレーニング・パイプラインを提供し、カスタム・データセットでモデルを微調整できるようにします。
法務上の注意書き¶
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。