handwritten-simplified-chinese-recognition-0001

ユースケースと概要説明

これは、手書き簡体字中国語文字認識シナリオ用のネットワークです。モデルは、特徴抽出器としての残差畳み込みニューラル・ネットワーク (CNN)、次に平坦化操作と、それに続く最終予測の分類器としての全結合レイヤーの 3 つの部分で構成されますネットワークは、SCUT-EPT データセット内の文字で構成される簡体字中国語テキストを認識できます。

-> 的人不一了是他有为在责新中任自之我们

仕様

メトリック

GFlops

134.513

MParams

17.270

SCUT-EPT テストサブセットの精度 (アスペクト比で高さ 96px にサイズ変更した後の幅 2000px を超える画像を除く)

75.31%

ソース・フレームワーク

PyTorch*

精度値

このモデルは、精度のメトリックとしてラベル誤り率を採用します。

入力

グレースケール・イメージ、名前 - actual_input、形状 - 1, 1, 96, 2000、形式 - B, C, H, W

説明:

  • B - バッチサイズ

  • C - チャネル数

  • H - 画像の髙さ

  • W - 画像の幅

注: ソース画像はアスペクト比を維持しながら特定の高さ (96 など) にサイズ変更する必要があり、変更後の幅は 2000 以下で、その後幅の右下をエッジ値で 2000 までパディングする必要があります。

出力

名前 - output、形状 - 125, 1, 4059、形式 - W, B, L

説明:

  • W - 出力シーケンス長

  • B - バッチサイズ

  • L - SCUT-EPT でサポートされているシンボル全体の信頼度分布。

ネットワーク出力は、CTC グリーディー・デコーダーでデコードできます。

デモの使い方

Open Model Zoo が提供する次のデモでこのモデルを使用して、その機能を確認できます。