nfnet-f0¶
ユースケースと概要説明¶
NFNet F0 は、ImageNet データセットで事前トレーニングされた画像分類ノーマライザーフリー・モデルの 1 つです。NFNet はノーマライザーフリーの ResNet であり、Adaptive Gradient Clipping (AGC) を使用し、パラメーター・ノルムに対する勾配ノルムのユニットごとの比率に基づいて勾配をクリップします。
F0 バリアントは、深さパターン [1、2、6、3] (各ステージに割り当てるボトルネック・ブロックの数を示す) を持つベースライン・バリアントです。後続の各バリアントには、この深さパターンが N 倍されます (F0 の場合は N = 1)。
モデル入力は、RGB
順に 1, 3, 256, 256
の単一イメージで構成されるブロブです。
モデル出力は、ImageNet データベース内の分類と一致する 1000 の異なる分類の典型的なオブジェクト分類子です。
仕様¶
メトリック |
値 |
---|---|
タイプ |
分類 |
GFLOPs |
24.8053 |
MParams |
71.4444 |
ソース・フレームワーク |
PyTorch* |
精度¶
メトリック |
値 |
---|---|
上位 1 |
83.34% |
上位 5 |
96.56% |
入力¶
元のモデル¶
画像、名前: image
、形状: 1, 3, 256, 256
、形式: B, C, H, W
。
説明:
B
- バッチサイズC
- チャネルH
- 高さW
- 幅
チャネルの順番は RGB
です。平均値: [123,675.116, 28,103.53, 103.53]、スケール値: [58.395, 57.12, 57.375]
変換されたモデル¶
画像、名前: image
、形状: 1, 3, 256, 256
、形式: B, C, H, W
。
説明:
B
- バッチサイズC
- チャネルH
- 高さW
- 幅
チャネルの順番は BGR
です。
出力¶
元のモデル¶
ImageNet クラスに基づくオブジェクト分類子、名前: probs
、形状: 1, 1000
、出力データ形式: B, C
。
説明:
B
- バッチサイズC
- ロジット形式の各クラスの予測確率
変換されたモデル¶
ImageNet クラスに基づくオブジェクト分類子、名前: probs
、形状: 1, 1000
、出力データ形式: B, C
。
説明:
B
- バッチサイズC
- ロジット形式の各クラスの予測確率
モデルをダウンロードして OpenVINO™ IR 形式に変換¶
以下の例に示すように、モデルをダウンロードし、必要に応じてモデル・ダウンローダーやその他の自動化ツールによってモデルを OpenVINO™ IR 形式に変換できます。
モデル・ダウンローダーの使用例:
omz_downloader --name <model_name>
モデル・コンバーターの使用例:
omz_converter --name <model_name>
法務上の注意書き¶
元のモデルは、Apache License バージョン 2.0 に基づいて配布されています。ライセンスの内容は、<omz_dir>/models/public/licenses/APACHE-2.0-PyTorch-Image-Models.txt
で確認できます。