levit-128s#

ユースケースと概要説明#

levit-128s モデルは、LeViT モデルファミリーの 1 つであり、高速推論画像分類用のハイブリッド・ニューラル・ネットワークです。モデルは ImageNet データセットで事前トレーニングされています。LeViT-128s モデルは、トランスステージの入力に 128 チャネルあり、モデルステージ 1、2、および 3 にそれぞれ 2、3、および 4 組のアテンション・ブロックと MLP ブロックのペアを備えた小型の LeViT バリアントです。

モデル入力は、RGB 順に 1, 3, 224, 224 の単一イメージで構成されるブロブです。

モデル出力は、ImageNet データベース内の分類と一致する 1000 の異なる分類の典型的なオブジェクト分類子です。

詳細は、リポジトリーとこちらをご覧ください。

仕様#

メトリック	値
タイプ	分類
GFLOPs	0.6177
MParams	8.2199
ソース・フレームワーク	PyTorch*

精度#

メトリック	値
上位 1	76.54%
上位 5	92.85%

入力#

元のモデル#

画像、名前: image、形状: 1, 3, 224, 224、形式: B, C, H, W、ここで:

B - バッチサイズ
C - チャネル
H - 髙さ
W - 幅

チャネルの順番は RGB です。平均値: [123,675.116, 28,103.53, 103.53]、スケール値: [58.395, 57.12, 57.375]

変換されたモデル#

画像、名前: image、形状: 1, 3, 224, 224、形式: B, C, H, W、ここで:

B - バッチサイズ
C - チャネル
H - 髙さ
W - 幅

チャネルの順番は BGR です。

出力#

元のモデル#

ImageNet クラスに基づくオブジェクト分類子、名前: probs、形状: 1, 1000、出力データ形式: B, C、ここで:

B - バッチサイズ
C - ロジット形式の各クラスの予測確率

変換されたモデル#

ImageNet クラスに基づくオブジェクト分類子、名前: probs、形状: 1, 1000、出力データ形式: B, C、ここで:

B - バッチサイズ
C - ロジット形式の各クラスの予測確率

モデルをダウンロードして OpenVINO™ IR 形式に変換#

以下の例に示すように、モデルをダウンロードし、必要に応じてモデル・ダウンローダーやその他の自動化ツールによってモデルを OpenVINO™ IR 形式に変換できます。

モデル・ダウンローダーの使用例:

omz_downloader --name <model_name>

モデル・コンバーターの使用例:

omz_converter --name <model_name>

デモの使い方#

このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します:

法務上の注意書き#

元のモデルは、Apache License バージョン 2.0 に基づいて配布されています。ライセンスの内容は、<omz_dir>/models/public/licenses/APACHE-2.0-PyTorch-Image-Models.txt で確認できます。