nanodet-plus-m-1.5x-416¶
ユースケースと概要説明¶
nanodet-plus-m-1.5x-416
モデルは NanoDet モデルファミリーの 1 つで、分類および回帰損失として一般化焦点損失を使用する FCOS スタイルの 1 ステージのアンカーフリー物体検出モデルです。NanoDet-Plus では、シンプルな割り当てガイダンスモジュール (AGM) と動的ソフト・ラベル・アサイナー (DSLA) を備えた新しいラベル割り当て方式が使用され、軽量モデル・トレーニングにおける最適なラベル割り当ての問題を解決します。また、マルチレイヤー機能の融合を強化するために、Ghost-PAN と呼ばれるライト機能ピラミッドが Plus モデルに導入されています。ShuffleNetV2 1.5x バックボーンを搭載した超高速の高精度軽量モデルです。このモデルは、Common Objects in Context (COCO) データセットで事前トレーニングされました。
詳細については、リポジトリーで説明されています。
仕様¶
メトリック |
値 |
---|---|
タイプ |
物体検出 |
GFLOPs |
3.0147 |
MParams |
2.4614 |
ソース・フレームワーク |
PyTorch* |
精度¶
変換されたモデルの Common Objects in Context (COCO) 検証データセットで取得された精度メトリック。80 の公開されている利用可能なオブジェクト・カテゴリーを含むラベルマップが使用されます。
メトリック |
値 |
---|---|
coco_orig_precision |
33.77% |
coco_precision |
34.53% |
入力¶
元のモデル¶
画像、名前: data
、形状: 1, 3, 416, 416
、形式: B, C, H, W
。
説明:
B
- バッチサイズC
- チャネル数H
- 画像の髙さW
- 画像の幅
予想される色の順序は BGR
です。
平均値: [103.53、116.28、123.675] スケール値 - [57.375、57.12、58.395]
変換されたモデル¶
画像、名前: data
、形状: 1, 3, 416, 416
、形式: B, C, H, W
。
説明:
B
- バッチサイズC
- チャネル数H
- 画像の髙さW
- 画像の幅
予想される色の順序は BGR
です。
出力¶
元のモデル¶
検出概要情報の配列、名前 - output
、形状 - 1, 3598, 112
、形式 - B, N, 112
。
説明:
B
- バッチサイズN
- 検出ボックスの数
検出ボックスの形式は次のとおりです。
ファイル
<omz_dir>/data/dataset_classes/coco_80cl.txt
にリストされている、パブリックな 80 個の Common Objects in Context (COCO) オブジェクト・クラスのロジット形式のクラス全体の 80 個の確率分布。A
* 4 形式の 8 * 4 の生の座標。ここで、A
は整数セットの最大値。
変換されたモデル¶
検出概要情報の配列、名前 - output
、形状 - 1, 3598, 112
、形式 - B, N, 112
。
説明:
B
- バッチサイズN
- 検出ボックスの数
検出ボックスの形式は次のとおりです。
ファイル
<omz_dir>/data/dataset_classes/coco_80cl.txt
にリストされている、パブリックな 80 個の Common Objects in Context (COCO) オブジェクト・クラスのロジット形式のクラス全体の 80 個の確率分布。A
* 4 形式の 8 * 4 の生の座標。ここで、A
は整数セットの最大値。
モデルをダウンロードして OpenVINO™ IR 形式に変換¶
以下の例に示すように、モデルをダウンロードし、必要に応じてモデル・ダウンローダーやその他の自動化ツールによってモデルを OpenVINO™ IR 形式に変換できます。
モデル・ダウンローダーの使用例:
omz_downloader --name <model_name>
モデル・コンバーターの使用例:
omz_converter --name <model_name>
法務上の注意書き¶
元のモデルは、Apache License バージョン 2.0 に基づいて配布されています。ライセンスの内容は、<omz_dir>/models/public/licenses/APACHE-2.0-PyTorch-NanoDet.txt
で確認できます。