PSROIPooling

バージョン名: PSROIPooling-1

カテゴリー: 物体検出

簡単な説明: PSROIPooling は、入力で指定された関心領域の位置に依存したプーリングを計算します。

詳細説明: リファレンス

PSROIPooling 操作には、特徴マップと関心領域 (ボックス座標) の 2 つの入力ブロブが必要です。後者は、5 つの要素タプル [batch_id, x_1, y_1, x_2, y_2] として指定されます。ROI 座標は、平均モードの場合は絶対値で指定され、双線形補間の場合は正規化された値 ([0,1] 間隔) で指定されます。

属性:

  • output_dim

    • 説明: output_dim は、プールされた出力チャネル番号です。

    • 値の範囲: 正の整数

    • タイプ: int

    • 必須: はい

  • group_size

    • 説明: group_size は、位置依存スコアマップをエンコードするグループの数です。

    • 値の範囲: 正の整数

    • タイプ: int

    • デフォルト値: 1

    • 必須: いいえ

  • spatial_scale

    • 説明: spatial_scale は、ROI 座標を入力スケールからプールする際に使用されるスケールに変換する乗算空間スケール係数です。

    • 値の範囲: 正の浮動小数点数

    • タイプ: float

    • 必須: はい

  • mode

    • 説明: mode ではプーリングのモードを指定します。

    • 値の範囲:

      • average - 平均プーリングを実行する

      • bilinear - 双一次補間によるプーリングの実行

    • タイプ: 文字列

    • デフォルト値 : average

    • 必須: いいえ

  • spatial_bins_x

    • 説明: spatial_bins_x は、入力特徴マップを幅で分割するビンの数を指定します。“バイリニア” モードのみに使用されます。

    • 値の範囲: 正の整数

    • タイプ: int

    • デフォルト値: 1

    • 必須: いいえ

  • spatial_bins_y

    • 説明: spatial_bins_y は、入力特徴マップを高さで分割するビンの数を指定します。“バイリニア” モードのみに使用されます。

    • 値の範囲: 正の整数

    • タイプ: int

    • デフォルト値: 1

    • 必須: いいえ

入力:

  • 1: 形状 [N, C, H, W] および特徴マップを備えたタイプ T の 4D 入力テンソル。必須。

  • 2: 形状 [num_boxes, 5] の 2D 入力テンソル。これには、対象領域を記述する 5 つの要素タプルのリスト [batch_id, x_1, y_1, x_2, y_2] が含まれています。必須。

バッチ・インデックスは [0, N-1] の範囲内にある必要があります。

出力:

  • 1: 2 番目の入力からのボックスの座標によって 1 番目の入力テンソルからコピーおよび補間された領域を持つ 4D 出力テンソル。

タイプ:

  • T: サポートされている浮動小数点タイプ。

例:

<layer ... type="PSROIPooling" ... >
    <data group_size="6" mode="bilinear" output_dim="360" spatial_bins_x="3" spatial_bins_y="3" spatial_scale="1"/>
    <input>
        <port id="0">
            <dim>1</dim>
            <dim>3240</dim>
            <dim>38</dim>
            <dim>38</dim>
        </port>
        <port id="1">
            <dim>100</dim>
            <dim>5</dim>
        </port>
    </input>
    <output>
        <port id="2">
            <dim>100</dim>
            <dim>360</dim>
            <dim>6</dim>
            <dim>6</dim>
        </port>
    </output>
</layer>