text-detection-0004¶
ユースケースと概要説明¶
屋内/屋外シーンのバックボーンとして MobileNetV2 (depth_multiplier=1.4) を使用した PixelLink アーキテクチャーに基づくテキスト検出器。
例¶
仕様¶
メトリック |
値 |
---|---|
F 値 (ICDAR2015 の精度とリコールの調和平均) |
79.43% |
GFlops |
23.305 |
MParams |
4.328 |
ソース・フレームワーク |
TensorFlow* |
入力¶
画像、名前: Placeholder
、形状: 1, 768, 1280, 3
、形式: B, H, W, C
。
説明:
B
- バッチサイズH
- 画像の髙さW
- 画像の幅C
- チャネル数
予想される色の順序: BGR
。
出力¶
名前:
model/link_logits_/add
、形状:1, 192, 320, 16
- ピクセルとその隣接ピクセル間のリンクに関連するロジット。名前:
model/segm_logits/add
、形状:1, 192, 320, 2
- 各ピクセルのテキスト/非テキスト分類に関連するロジット。
詳細については、PixelLink とデモを参照してください。
法務上の注意書き¶
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。