nanodet-m-1.5x-416

ユースケースと概要説明

nanodet-m-1.5x-416 モデルは NanoDet モデルファミリーの 1 つで、分類および回帰損失として一般化焦点損失を使用する FCOS スタイルの 1 ステージのアンカーフリー物体検出モデルです。ShuffleNetV2 1.5x バックボーンを搭載した超高速な高精度軽量モデルです。このモデルは、Common Objects in Context (COCO) データセットで事前トレーニングされました。

詳細については、リポジトリーで説明されています。

仕様

メトリック

タイプ

物体検出

GFLOPs

2.3895

MParams

2.0534

ソース・フレームワーク

PyTorch*

精度

変換されたモデルの Common Objects in Context (COCO) 検証データセットで取得された精度メトリック。80 の公開されている利用可能なオブジェクト・カテゴリーを含むラベルマップが使用されます。

メトリック

coco_orig_precision

27.38%

coco_precision

26.63%

入力

元のモデル

画像、名前: data、形状: 1, 3, 416, 416、形式: B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル数

  • H - 画像の髙さ

  • W - 画像の幅

予想される色の順序は BGR です。

平均値: [103.53、116.28、123.675] スケール値 - [57.375、57.12、58.395]

変換されたモデル

画像、名前: data、形状: 1, 3, 416, 416、形式: B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル数

  • H - 画像の髙さ

  • W - 画像の幅

予想される色の順序は BGR です。

出力

元のモデル

検出概要情報の配列、名前 - output、形状 - 1, 3549, 112、形式 - B, N, 112

説明:

  • B - バッチサイズ

  • N - 検出ボックスの数

検出ボックスの形式は次のとおりです。

  • ファイル <omz_dir>/data/dataset_classes/coco_80cl.txt にリストされている、パブリックな 80 個の Common Objects in Context (COCO) オブジェクト・クラスのロジット形式のクラス全体の 80 個の確率分布。

  • A * 4 形式の 8 * 4 の生の座標。ここで、A は整数セットの最大値。

変換されたモデル

検出概要情報の配列、名前 - output、形状 - 1, 3549, 112、形式 - B, N, 112

説明:

  • B - バッチサイズ

  • N - 検出ボックスの数

検出ボックスの形式は次のとおりです。

  • ファイル <omz_dir>/data/dataset_classes/coco_80cl.txt にリストされている、パブリックな 80 個の Common Objects in Context (COCO) オブジェクト・クラスのロジット形式のクラス全体の 80 個の確率分布。

  • A * 4 形式の 8 * 4 の生の座標。ここで、A - 整数セットの最大値。

モデルをダウンロードして OpenVINO™ IR 形式に変換

以下の例に示すように、モデルをダウンロードし、必要に応じてモデル・ダウンローダーやその他の自動化ツールによってモデルを OpenVINO™ IR 形式に変換できます。

モデル・ダウンローダーの使用例:

omz_downloader --name <model_name>

モデル・コンバーターの使用例:

omz_converter --name <model_name>

デモの使い方

Open Model Zoo が提供する次のデモでこのモデルを使用して、その機能を確認できます。