handwritten-japanese-recognition-0001#
ユースケースと概要説明#
これは、手書き日本語文字認識シナリオ用のネットワークです。VGG16 のようなバックボーン、形状変更レイヤー、および完全に接続されたレイヤーで構成されます。ネットワークは、Kondate データセットと Nakayosi データセットの文字で構成される日本語テキストを認識できます。
例#
- 菊池朋子
仕様#
メトリック |
値 |
---|---|
GFlops |
117.136 |
MParams |
15.31 |
Kondate テストセットと Nakayosi から生成されたテストセットの精度 |
98.16% |
ソース・フレームワーク |
PyTorch* |
精度値#
このデモでは、精度のメトリックとしてラベルエラー率を採用しています。
入力#
グレースケール・イメージ、名前 - actual_input
、形状 - 1, 1, 96, 2000
、形式 - B, C, H, W
、ここで:
B
- バッチサイズC
- チャネル数H
- 画像の髙さW
- 画像の幅
注: ソース画像はアスペクト比を維持しながら特定の高さ (96 など) にサイズ変更する必要があり、変更後の幅は 2000 以下で、その後幅の右下をエッジ値で 2000 までパディングする必要があります。
出力#
名前 - output
、形状 - 186, 1, 4442
、形式 - W, B, L
、ここで:
ネットワーク出力は、CTC グリーディー・デコーダーでデコードできます。
デモの使い方#
このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します:
法務上の注意書き#
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。