person-detection-asl-0001

ユースケースと概要説明

ASL 認識シナリオ用の人物検出器です。3x3 畳み込みブロックと FCOS ヘッドの計算量を削減する深さ方向の畳み込みを含む ShuffleNetV2 に似たバックボーンを基にしています。

仕様

メトリック

COCO 上の個人 AP

79.35%

最小の人の身長

100 ピクセル

GFlops

0.986

MParams

1.338

ソース・フレームワーク

PyTorch*

平均精度 (AP) は、精度/再現率曲線の下の領域として定義されます。

入力

画像、名前: image、形状: 1, 3, 320, 320、形式: 1, C, H, W

説明:

  • C - チャネル数

  • H - 画像の髙さ

  • W - 画像の幅

予想される色の順序は BGR です。

出力

最終出力は、形状: 100, 5、形式: N, 5 のブロブです。ここで、N は検出された境界ボックスの数です。各検出の説明は [x_min, y_min, x_max, y_max, conf] の形式です。
説明:

  • (x_min, y_min) - 境界ボックスの左上隅の座標

  • (x_max, y_max) - 境界ボックスの右下隅の座標

  • conf - 予測されたクラスの信頼度

デモの使い方

Open Model Zoo が提供する次のデモでこのモデルを使用して、その機能を確認できます。