PriorBoxClustered

バージョン名: PriorBoxClustered-1

カテゴリー: 物体検出

簡単な説明: ExperimentalDetectronPriorGridGenerator 操作は、入力画像サイズに正規化され指定されたサイズの前のボックスを生成します。

詳細な説明:

以下のようにします。

\[W \equiv image\_width, \quad H \equiv image\_height.\]

PriorBoxClustered の計算は次のように記述できます。

\[center_x=(w+offset)*step\]
\[center_y=(h+offset)*step\]
\[w \subset \left( 0, W \right )\]
\[h \subset \left( 0, H \right )\]

それぞれの \(s = \overline{0, W - 1}\) について、前のボックスの座標が計算されます。

\[xmin = \frac{center_x - \frac{width_s}{2}}{W}\]
\[ymin = \frac{center_y - \frac{height_s}{2}}{H}\]
\[xmax = \frac{center_x - \frac{width_s}{2}}{W}\]
\[ymax = \frac{center_y - \frac{height_s}{2}}{H}\]

clip が定義されている場合、前のボックスの座標が次の式で再計算されます: \(coordinate = \min(\max(coordinate,0), 1)\)

属性:

  • width (height)

    • 説明: width (height) は、ボックスの幅 (高さ) をピクセル単位で指定します。

    • 値の範囲: 正の浮動小数点数

    • タイプ: float[]

    • デフォルト値: 1.0

    • 必須: いいえ

  • clip

    • 説明: clip は、出力テンソルの各値を [0,1] 内でクリップする必要があるかどうかを示すフラグです。

    • 値の範囲:

      • false または 0 - クリッピングは行われません

      • true または 1 - 出力テンソルの各値は次の範囲内にあります: [0,1]

    • タイプ: boolean

    • デフォルト値: true

    • 必須: いいえ

  • step (step_w, step_h)

    • 説明: step (step_w, step_h) はボックスの中心間の距離です。例えば、step が 85 に等しいと、近隣の以前のボックスの中心間の距離が 85 であることを意味します。step_hstep_w の両方が 0 の場合、step の値で更新されます。その後も 0 である場合は、入力画像の幅 (高さ) を最初の入力幅 (高さ) で割ったものとして計算されます。

    • 値の範囲: 浮動小数点の正の数

    • タイプ: float

    • デフォルト値: 0.0

    • 必須: いいえ

  • offset

    • 説明: offset はそれぞれボックスの左上隅へのシフトです。例えば、offset が 85 に等しい場合、近隣の以前のボックスの中心のシフトが 85 であることを意味します。

    • 値の範囲: 浮動小数点の正の数

    • タイプ: float

    • 必須: はい

  • variance

    • 説明: variance は、境界ボックスの調整の分散を示します。属性には 0、1、または 4 つの要素を指定できます。

    • 値の範囲: 正の浮動小数点数

    • タイプ: float[]

    • デフォルト値: []

    • 必須: いいえ

入力:

  • 1: output_size - 2 つの要素 [height, width] を持つ T_INT タイプの 1D テンソル。生成されるグリッドの空間サイズをボックスで指定します。必須。

  • 2: image_size - ボックスが生成される画像の形状を指定する 2 つの要素 [image_height, image_width] を持つ T_INT タイプの 1D テンソル。オプションです。

出力:

  • 1: 形状 [2, 4 * height * width * priors_per_point] の 2D テンソル、ボックス座標を持つ T_OUT タイプ。priors_per_point は、各グリッド要素ごとに生成されるボックスの数です。この数はレイヤーの属性値によって異なります。

タイプ:

  • T_INT: サポートされている整数タイプ。

  • T_OUT: サポートされている浮動小数点タイプ。

例:

<layer type="PriorBoxClustered" ... >
    <data clip="false" height="44.0,10.0,30.0,19.0,94.0,32.0,61.0,53.0,17.0" offset="0.5" step="16.0" variance="0.1,0.1,0.2,0.2" width="86.0,13.0,57.0,39.0,68.0,34.0,142.0,50.0,23.0"/>
    <input>
        <port id="0">
            <dim>2</dim>        <!-- [10, 19] -->
        </port>
        <port id="1">
            <dim>2</dim>        <!-- [180, 320] -->
        </port>
    </input>
    <output>
        <port id="2">
            <dim>2</dim>
            <dim>6840</dim>
        </port>
    </output>
</layer>