efficientnet-v2-s#

ユースケースと概要説明#

efficientnet-v2-s モデルは、ImageNet-21k データセットで事前トレーニングされ、画像分類タスク用に ImageNet-1k で微調整された EfficientNetV2 の小さなバリアントです。EfficientNetV2 は、以前のモデルよりもトレーニング速度が速く、パラメーター効率が優れている畳み込みネットワークの新しいファミリーです。トレーニングを考慮したニューラル・アーキテクチャーの検索とスケーリングの組み合わせが開発に使用され、トレーニングの速度とパラメーターの効率を共同で最適化しました。

詳細については、論文およびリポジトリーで説明されています。

仕様#

メトリック	値
タイプ	分類
GFlops	16.9406
MParams	21.3816
ソース・フレームワーク	PyTorch*

精度#

メトリック	値
上位 1	84.29%
上位 5	97.26%

入力#

元のモデル#

画像、名前: input、形状: 1, 3, 384, 384、形式: B, C, H, W、ここで:

B - バッチサイズ
C - チャネル数
H - 画像の髙さ
W - 画像の幅

予想される色の順序: RGB。平均値: [127.5, 127.5, 127.5]、スケール値: [127.5, 127.5, 127.5]

変換されたモデル#

画像、名前: input、形状: 1, 3, 384, 384、形式: B, C, H, W、ここで:

B - バッチサイズ
C - チャネル数
H - 画像の髙さ
W - 画像の幅

予想される色の順序: BGR。

出力#

元のモデル#

ImageNet クラスに基づくオブジェクト分類子、名前: logits、形状: 1, 1000、出力データ形式: B, C、ここで:

B - バッチサイズ
C - ロジット形式のすべてのデータセット・クラスの確率ベクトル。

変換されたモデル#

ImageNet クラスに基づくオブジェクト分類子、名前: logits、形状: 1, 1000、出力データ形式: B, C、ここで:

B - バッチサイズ
C - ロジット形式のすべてのデータセット・クラスの確率ベクトル。

モデルをダウンロードして OpenVINO™ IR 形式に変換#

以下の例に示すように、モデルをダウンロードし、必要に応じてモデル・ダウンローダーやその他の自動化ツールによってモデルを OpenVINO™ IR 形式に変換できます。

モデル・ダウンローダーの使用例:

omz_downloader --name <model_name>

モデル・コンバーターの使用例:

omz_converter --name <model_name>

デモの使い方#

このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します:

分類ベンチマーク Python* デモ

法務上の注意書き#

元のモデルは、Apache License バージョン 2.0 に基づいて配布されています。ライセンスの内容は、<omz_dir>/models/public/licenses/APACHE-2.0-PyTorch-Image-Models.txt で確認できます。