text-detection-0003¶
ユースケースと概要説明¶
屋内/屋外シーンのバックボーンとして MobileNetV2 のような PixelLink アーキテクチャーに基づくテキスト検出器。
例¶
仕様¶
メトリック |
値 |
---|---|
F 値 (ICDAR2015 の精度とリコールの調和平均) |
82.12% |
GFlops |
51.256 |
MParams |
6.747 |
ソース・フレームワーク |
TensorFlow* |
入力¶
画像、名前: Placeholder
、形状: 1, 768, 1280, 3
、形式: B, H, W, C
。
説明:
B
- バッチサイズH
- 画像の髙さW
- 画像の幅C
- チャネル数
予想される色の順序: BGR
。
出力¶
名前:
model/link_logits_/add
、形状:1, 192, 320, 16
- ピクセルとその隣接ピクセル間のリンクに関連するロジット。名前:
model/segm_logits/add
、形状:1, 192, 320, 2
- 各ピクセルのテキスト/非テキスト分類に関連するロジット。
詳細については、PixelLink とデモを参照してください。
法務上の注意書き¶
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。