detr-resnet50

ユースケースと概要説明

detr-resnet50 モデルは、オブジェクト検出を直接セット予測問題として考慮する DEtection TRansformer (DETR) モデルファミリーの 1 つです。このモデルには ResNet50 バックボーンがあり、オブジェクト検出タスクを解決するため Common Objects in Context (COCO) データセットで事前トレーニングされています。DETR はすべてのオブジェクトを一度に予測し、予測されたオブジェクトとグラウンド・トゥルース・オブジェクト間のペアマッチングを実行するセット損失関数を使用してエンドツーエンドでトレーニングされます。DETR は、空間アンカーや非最大抑制などの事前知識をエンコードする複数の手作業で設計されたコンポーネントを削除することで、検出パイプラインを簡素化します。

詳細については、論文およびリポジトリーで説明されています。

仕様

メトリック

タイプ

物体検出

GFLOPs

174.4708

MParams

41.3293

ソース・フレームワーク

PyTorch*

精度

変換されたモデルの Common Objects in Context (COCO) 検証データセットで取得された精度メトリック。80 個のパブリックなオブジェクト・カテゴリーを含む背景ラベル + ラベルマップが使用されます (91 個のカテゴリーへの元のインデックス付けは保持されます)。

メトリック

coco_orig_precision

39.27%

coco_precision

42.36%

入力

元のモデル

画像、名前: input、形状: 1, 3, 800, 1137、形式: B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル数

  • H - 画像の髙さ

  • W - 画像の幅

予想される色の順序は RGB です。

平均値: [123.675、116.28、103.53] スケール値 - [58.395、57.12、57.375]

変換されたモデル

画像、名前: input、形状: 1, 3, 800, 1137、形式: B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル数

  • H - 画像の髙さ

  • W - 画像の幅

予想される色の順序は BGR です。

出力

元のモデル

  1. 境界ボックス、名前: boxes、形状 - 1, 100, 4。形式: B, A, 4

    説明:

    • B - バッチサイズ

    • A - 検出されたアンカーの数

    各検出の説明の形式は次のとおりです: [x, y, w, h]。

    説明:

    • (xy) - 境界ボックスの中心の座標 (座標は正規化された形式で、範囲は [0, 1])

    • w - 境界ボックスの幅 (値は正規化された形式で、範囲は [0, 1] です)

    • h - 境界ボックスの高さ (値は正規化された形式で、範囲は [0, 1] です)

  2. スコア、名前: scores、形状 - 1, 100, 92。91 個の Common Objects in Context (COCO) オブジェクト・クラスのスコアがロジット形式で含まれています。最後のクラスは no-object クラスです。

変換されたモデル

  1. 境界ボックス、名前: boxes、形状 - 1, 100, 4。形式: B, A, 4

    説明:

    • B - バッチサイズ

    • A - 検出されたアンカーの数

    各検出の説明の形式は次のとおりです: [x, y, w, h]。

    説明:

    • (x, y) - 境界ボックスの中心の座標 (座標は正規化された形式で、範囲は [0, 1])

    • w - 境界ボックスの幅 (値は正規化された形式で、範囲は [0, 1] です)

    • h - 境界ボックスの高さ (値は正規化された形式で、範囲は [0, 1] です)

  2. スコア、名前: scores、形状 - 1, 100, 92。91 個の Common Objects in Context (COCO) オブジェクト・クラスのスコアがロジット形式で含まれています。最後のクラスは no-object クラスです。

モデルをダウンロードして OpenVINO™ IR 形式に変換

以下の例に示すように、モデルをダウンロードし、必要に応じてモデル・ダウンローダーやその他の自動化ツールによってモデルを OpenVINO™ IR 形式に変換できます。

モデル・ダウンローダーの使用例:

omz_downloader --name <model_name>

モデル・コンバーターの使用例:

omz_converter --name <model_name>

デモの使い方

Open Model Zoo が提供する次のデモでこのモデルを使用して、その機能を確認できます。