PSROIPooling¶
バージョン名: PSROIPooling-1
カテゴリー: 物体検出
簡単な説明: PSROIPooling は、入力で指定された関心領域の位置に依存したプーリングを計算します。
詳細説明: リファレンス。
PSROIPooling 操作には、特徴マップと関心領域 (ボックス座標) の 2 つの入力ブロブが必要です。後者は、5 つの要素タプル [batch_id, x_1, y_1, x_2, y_2] として指定されます。ROI 座標は、平均モードの場合は絶対値で指定され、双線形補間の場合は正規化された値 ([0,1] 間隔) で指定されます。
属性:
-
output_dim
説明: output_dim は、プールされた出力チャネル番号です。
値の範囲: 正の整数
タイプ:
int
必須: はい
-
group_size
説明: group_size は、位置依存スコアマップをエンコードするグループの数です。
値の範囲: 正の整数
タイプ:
int
デフォルト値: 1
必須: いいえ
-
spatial_scale
説明: spatial_scale は、ROI 座標を入力スケールからプールする際に使用されるスケールに変換する乗算空間スケール係数です。
値の範囲: 正の浮動小数点数
タイプ:
float
必須: はい
-
mode
説明: mode ではプーリングのモードを指定します。
-
値の範囲:
average - 平均プーリングを実行する
bilinear - 双一次補間によるプーリングの実行
タイプ: 文字列
デフォルト値 : average
必須: いいえ
-
spatial_bins_x
説明: spatial_bins_x は、入力特徴マップを幅で分割するビンの数を指定します。“バイリニア” モードのみに使用されます。
値の範囲: 正の整数
タイプ:
int
デフォルト値: 1
必須: いいえ
-
spatial_bins_y
説明: spatial_bins_y は、入力特徴マップを高さで分割するビンの数を指定します。“バイリニア” モードのみに使用されます。
値の範囲: 正の整数
タイプ:
int
デフォルト値: 1
必須: いいえ
入力:
1: 形状
[N, C, H, W]
および特徴マップを備えたタイプ T の 4D 入力テンソル。必須。2: 形状
[num_boxes, 5]
の 2D 入力テンソル。これには、対象領域を記述する 5 つの要素タプルのリスト[batch_id, x_1, y_1, x_2, y_2]
が含まれています。必須。
バッチ・インデックスは [0, N-1]
の範囲内にある必要があります。
出力:
1: 2 番目の入力からのボックスの座標によって 1 番目の入力テンソルからコピーおよび補間された領域を持つ 4D 出力テンソル。
タイプ:
T: サポートされている浮動小数点タイプ。
例:
<layer ... type="PSROIPooling" ... >
<data group_size="6" mode="bilinear" output_dim="360" spatial_bins_x="3" spatial_bins_y="3" spatial_scale="1"/>
<input>
<port id="0">
<dim>1</dim>
<dim>3240</dim>
<dim>38</dim>
<dim>38</dim>
</port>
<port id="1">
<dim>100</dim>
<dim>5</dim>
</port>
</input>
<output>
<port id="2">
<dim>100</dim>
<dim>360</dim>
<dim>6</dim>
<dim>6</dim>
</port>
</output>
</layer>