detr-resnet50¶
ユースケースと概要説明¶
detr-resnet50
モデルは、オブジェクト検出を直接セット予測問題として考慮する DEtection TRansformer (DETR) モデルファミリーの 1 つです。このモデルには ResNet50 バックボーンがあり、オブジェクト検出タスクを解決するため Common Objects in Context (COCO) データセットで事前トレーニングされています。DETR はすべてのオブジェクトを一度に予測し、予測されたオブジェクトとグラウンド・トゥルース・オブジェクト間のペアマッチングを実行するセット損失関数を使用してエンドツーエンドでトレーニングされます。DETR は、空間アンカーや非最大抑制などの事前知識をエンコードする複数の手作業で設計されたコンポーネントを削除することで、検出パイプラインを簡素化します。
仕様¶
メトリック |
値 |
---|---|
タイプ |
物体検出 |
GFLOPs |
174.4708 |
MParams |
41.3293 |
ソース・フレームワーク |
PyTorch* |
精度¶
変換されたモデルの Common Objects in Context (COCO) 検証データセットで取得された精度メトリック。80 個のパブリックなオブジェクト・カテゴリーを含む背景ラベル + ラベルマップが使用されます (91 個のカテゴリーへの元のインデックス付けは保持されます)。
メトリック |
値 |
---|---|
coco_orig_precision |
39.27% |
coco_precision |
42.36% |
入力¶
元のモデル¶
画像、名前: input
、形状: 1, 3, 800, 1137
、形式: B, C, H, W
。
説明:
B
- バッチサイズC
- チャネル数H
- 画像の髙さW
- 画像の幅
予想される色の順序は RGB
です。
平均値: [123.675、116.28、103.53] スケール値 - [58.395、57.12、57.375]
変換されたモデル¶
画像、名前: input
、形状: 1, 3, 800, 1137
、形式: B, C, H, W
。
説明:
B
- バッチサイズC
- チャネル数H
- 画像の髙さW
- 画像の幅
予想される色の順序は BGR
です。
出力¶
元のモデル¶
-
境界ボックス、名前:
boxes
、形状 -1, 100, 4
。形式:B, A, 4
。説明:
B
- バッチサイズA
- 検出されたアンカーの数
各検出の説明の形式は次のとおりです: [
x
,y
,w
,h
]。説明:
(
x
、y
) - 境界ボックスの中心の座標 (座標は正規化された形式で、範囲は [0, 1])w
- 境界ボックスの幅 (値は正規化された形式で、範囲は [0, 1] です)h
- 境界ボックスの高さ (値は正規化された形式で、範囲は [0, 1] です)
スコア、名前:
scores
、形状 -1, 100, 92
。91 個の Common Objects in Context (COCO) オブジェクト・クラスのスコアがロジット形式で含まれています。最後のクラスはno-object
クラスです。
変換されたモデル¶
-
境界ボックス、名前:
boxes
、形状 -1, 100, 4
。形式:B, A, 4
。説明:
B
- バッチサイズA
- 検出されたアンカーの数
各検出の説明の形式は次のとおりです: [
x
,y
,w
,h
]。説明:
(
x
,y
) - 境界ボックスの中心の座標 (座標は正規化された形式で、範囲は [0, 1])w
- 境界ボックスの幅 (値は正規化された形式で、範囲は [0, 1] です)h
- 境界ボックスの高さ (値は正規化された形式で、範囲は [0, 1] です)
スコア、名前:
scores
、形状 -1, 100, 92
。91 個の Common Objects in Context (COCO) オブジェクト・クラスのスコアがロジット形式で含まれています。最後のクラスはno-object
クラスです。
モデルをダウンロードして OpenVINO™ IR 形式に変換¶
以下の例に示すように、モデルをダウンロードし、必要に応じてモデル・ダウンローダーやその他の自動化ツールによってモデルを OpenVINO™ IR 形式に変換できます。
モデル・ダウンローダーの使用例:
omz_downloader --name <model_name>
モデル・コンバーターの使用例:
omz_converter --name <model_name>
法務上の注意書き¶
元のモデルは、Apache License バージョン 2.0 に基づいて配布されています。ライセンスの内容は、<omz_dir>/models/public/licenses/APACHE-2.0-FacebookResearch.txt
で確認できます。