text-detection-0003#
ユースケースと概要説明#
屋内/屋外シーンのバックボーンとして MobileNetV2 のような PixelLink アーキテクチャーに基づくテキスト検出器。
例#
仕様#
メトリック |
値 |
---|---|
F 値 (ICDAR2015 の精度とリコールの調和平均) |
82.12% |
GFlops |
51.256 |
MParams |
6.747 |
ソース・フレームワーク |
TensorFlow* |
入力#
画像、名前: Placeholder
、形状: 1, 768, 1280, 3
、形式: B, H, W, C
、ここで:
B
- バッチサイズH
- 画像の髙さW
- 画像の幅C
- チャネル数
予想される色の順序: BGR
。
出力#
名前:
model/link_logits_/add
、形状:1, 192, 320, 16
- ピクセルとその隣接ピクセル間のリンクに関連するロジット。名前:
model/segm_logits/add
、形状:1, 192, 320, 2
- 各ピクセルのテキスト/非テキスト分類に関連するロジット。
詳細については、PixelLink とデモを参照してください。
デモの使い方#
このモデルは、Open Model Zoo が提供する次のデモで使用して、その機能を示します:
法務上の注意書き#
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。