handwritten-japanese-recognition-0001

ユースケースと概要説明

これは、手書き日本語文字認識シナリオ用のネットワークです。VGG16 のようなバックボーン、形状変更レイヤー、および全結合レイヤーで構成されます。ネットワークは、Kondate データセットと Nakayosi データセットの文字で構成される日本語テキストを認識できます。

-> 菊池朋子

仕様

メトリック

GFlops

117.136

MParams

15.31

Kondate テストセットと Nakayosi から生成されたテストセットの精度

98.16%

ソース・フレームワーク

PyTorch*

精度値

このデモでは、精度のメトリックとしてラベルエラー率を採用しています。

入力

グレースケール・イメージ、名前 - actual_input、形状 - 1, 1, 96, 2000、形式 - B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル数

  • H - 画像の髙さ

  • W - 画像の幅

注: ソース画像はアスペクト比を維持しながら特定の高さ (96 など) にサイズ変更する必要があり、変更後の幅は 2000 以下で、その後幅の右下をエッジ値で 2000 までパディングする必要があります。

出力

名前 - output、形状 - 186, 1, 4442、形式 - W, B, L

説明:

  • W - 出力シーケンス長

  • B - バッチサイズ

  • L - KondateNakayosi でサポートされているシンボル間の信頼度分布。

ネットワーク出力は、CTC グリーディー・デコーダーでデコードできます。

デモの使い方

Open Model Zoo が提供する次のデモでこのモデルを使用して、その機能を確認できます。