person-detection-0106

ユースケースと概要説明

これは、ResNet50 バックボーンを備えた Cascade R-CNN アーキテクチャーに基づく人物検出器です。

仕様

メトリック

AP @ [ IoU=0.50:0.95 ]

0.442 (内部テストセット)

GFlops

404.264

MParams

71.565

ソース・フレームワーク

PyTorch*

平均精度 (AP) は、精度/再現率曲線の下の領域として定義されます。

入力

画像、名前: image、形状: 1, 3, 800, 1344、形式: B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル数

  • H - 画像の髙さ

  • W - 画像の幅

予想される色の順序は BGR です。

出力

モデルには動的形状の出力があります。

  1. boxes は、形状 -1, 5、形式 N, 5 のブロブです。ここで N は検出された境界ボックスの数です。各検出の形式は次のとおりです。
    [x_min, y_min, x_max, y_max, conf]

    説明:

    • (x_min, y_min) - 境界ボックスの左上隅の座標

    • (x_max, y_max) - 境界ボックスの右下隅の座標

    • conf - 予測されたクラスの信頼度

  2. labels は、形状 -1、形式 N のブロブです。ここで N は検出された境界ボックスの数です。これには、検出された各ボックスごとの予測クラス ID (0 - 人) が含まれます。

デモの使い方

Open Model Zoo が提供する次のデモでこのモデルを使用して、その機能を確認できます。