swin-tiny-patch4-window7-224¶
ユースケースと概要説明¶
swin-tiny-patch4-window7-224
モデルは、ImageNet データセットで事前トレーニングされた Swin Transformer 画像分類モデルの tiny
(小さな) バージョンです。Swin Transformer は、シフトされたウィンドウで表現が計算される階層型ビジョン・トランスフォーマーです。各パッチはサイズ 4 のトークンとして扱われ、特徴は生のピクセル RGB 値の連結として設定されます。モデルには各ウィンドウに 7 つのパッチがあります。モデルの小さなバージョンのステージには、それぞれ 2、2、6、2 つのレイヤーがあります。小さなバリアントの最初のステージの隠れ層のチャネル数は 96 です。
仕様¶
メトリック |
値 |
---|---|
タイプ |
分類 |
GFlops |
9.0280 |
MParams |
28.8173 |
ソース・フレームワーク |
PyTorch* |
精度¶
メトリック |
値 |
---|---|
上位 1 |
81.38% |
上位 5 |
95.51% |
入力¶
元のモデル¶
画像、名前: input
、形状: 1, 3, 224, 224
、形式: B, C, H, W
。
説明:
B
- バッチサイズC
- チャネル数H
- 画像の髙さW
- 画像の幅
予想される色の順序: RGB
。平均値: [123.675, 116.28, 103.53]、スケール値: [58.395, 57.12, 57.375]
変換されたモデル¶
画像、名前: input
、形状: 1, 3, 224, 224
、形式: B, C, H, W
。
説明:
B
- バッチサイズC
- チャネル数H
- 画像の髙さW
- 画像の幅
予想される色の順序: BGR
。
出力¶
元のモデル¶
ImageNet クラスに基づくオブジェクト分類子、名前: probs
、形状: 1, 1000
、出力データ形式: B, C
。
説明:
B
- バッチサイズC
- [0, 1] の範囲の各クラスの予測確率
変換されたモデル¶
ImageNet クラスに基づくオブジェクト分類子、名前: probs
、形状: 1, 1000
、出力データ形式: B, C
。
説明:
B
- バッチサイズC
- [0, 1] の範囲の各クラスの予測確率
モデルをダウンロードして OpenVINO™ IR 形式に変換¶
以下の例に示すように、モデルをダウンロードし、必要に応じてモデル・ダウンローダーやその他の自動化ツールによってモデルを OpenVINO™ IR 形式に変換できます。
モデル・ダウンローダーの使用例:
omz_downloader --name <model_name>
モデル・コンバーターの使用例:
omz_converter --name <model_name>
法務上の注意書き¶
元のモデルは、Apache License バージョン 2.0 に基づいて配布されています。ライセンスの内容は、<omz_dir>/models/public/licenses/APACHE-2.0-PyTorch-Image-Models.txt
で確認できます。