repvgg-a0

ユースケースと概要説明

RepVGG-A0 は、ImageNet データセットで事前トレーニングされた RepVGG 画像分類モデルの 1 つです。RepVGG は畳み込みニューラル・ネットワークのアーキテクチャーであり、VGG のような推論時間本体と構造的な再パラメーター化手法を備えています。3×3 レイヤーは 5 つのステージに配置されています。RepVGG-A ステージにはそれぞれ 1、2、4、14、1 レイヤーがあります。これらのモデルのレイヤー幅は、[64a、128a、256a、512b] の従来の幅設定を均一にスケーリングすることで決定されます。RepVGG-A0 モデルの乗数は a = 0.75 および b = 2.5 です。

モデル入力は、RGB 順に 1, 3, 224, 224 の単一イメージで構成されるブロブです。

モデル出力は、ImageNet データベース内の分類と一致する 1000 の異なる分類の典型的なオブジェクト分類子です。

詳細は、リポジトリーこちらをご覧ください。

仕様

メトリック

タイプ

分類

GFLOPs

2.7286

MParams

8.3094

ソース・フレームワーク

PyTorch*

精度

メトリック

上位 1

72.40%

上位 5

90.49%

入力

元のモデル

画像、名前: input、形状: 1, 3, 224, 224、形式: B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル

  • H - 高さ

  • W - 幅

チャネルの順番は RGB です。平均値: [123.675, 116.28, 103.53]、スケール値: [58.395, 57.12, 57.375]

変換されたモデル

画像、名前: input、形状: 1, 3, 224, 224、形式: B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル

  • H - 高さ

  • W - 幅

チャネルの順番は BGR です。

出力

元のモデル

ImageNet クラスに基づくオブジェクト分類子、名前: output、形状: 1, 1000、出力データ形式: B, C

説明:

  • B - バッチサイズ

  • C - ロジット形式の各クラスの予測確率

変換されたモデル

ImageNet クラスに基づくオブジェクト分類子、名前: output、形状: 1, 1000、出力データ形式: B, C

説明:

  • B - バッチサイズ

  • C - ロジット形式の各クラスの予測確率

モデルをダウンロードして OpenVINO™ IR 形式に変換

以下の例に示すように、モデルをダウンロードし、必要に応じてモデル・ダウンローダーやその他の自動化ツールによってモデルを OpenVINO™ IR 形式に変換できます。

モデル・ダウンローダーの使用例:

omz_downloader --name <model_name>

モデル・コンバーターの使用例:

omz_converter --name <model_name>

デモの使い方

Open Model Zoo が提供する次のデモでこのモデルを使用して、その機能を確認できます。