ExperimentalDetectronGenerateProposalsSingleImage

バージョン名: ExperimentalDetectronGenerateProposalsSingleImage-6

カテゴリー: 物体検出

簡単な説明: ExperimentalDetectronGenerateProposalsSingleImage 操作は、入力データに基づいて ROI とスコアを計算します。

詳細な説明: 操作では次の手順が実行されます。

  1. 予測されたバウンディング・ボックスのデルタとスコアを転置および再形成して、アンカーと同じ順序にします。

  2. デルタを使用してアンカーをプロポーザルに変換し、画像にクリップします。

  3. 高さまたは幅 < min_size の予測ボックスを削除します。

  4. すべての (proposal, score) のペアをスコアの高い順から低い順に並べ替えます。スコアが等しいペアの順序は定義されていません。

  5. プロポーザルの合計数が pre_nms_count 未満の場合は、上位の pre_nms_count プロポーザルから、すべてのプロポーザルを取得します。

  6. nms_threshold を使用して最大以外の抑制を適用します。

  7. 上位の post_nms_count プロポーザルを取得し、上位のプロポーザルとそのスコアを返します。プロポーザルの合計数が post_nms_count より少ない場合、ゼロで埋められた出力テンソルが返されます。

属性:

  • min_size

    • 説明: min_size 属性は、ボックスの最小の幅と高さを指定します。

    • 値の範囲: 負でない浮動小数点数

    • タイプ: float

    • デフォルト値: なし

    • 必須: はい

  • nms_threshold

    • 説明: nms_threshold 属性は、NMS ステージで使用されるしきい値を指定します。

    • 値の範囲: 負でない浮動小数点数

    • タイプ: float

    • デフォルト値: なし

    • 必須: はい

  • pre_nms_count

    • 説明: pre_nms_count 属性は、NMS 前の上位 n プロポーザルの数を指定します。

    • 値の範囲: 負でない整数

    • タイプ: int

    • デフォルト値: なし

    • 必須: はい

  • post_nms_count

    • 説明: post_nms_count 属性は、NMS 後の上位 n プロポーザルの数を指定します。

    • 値の範囲: 負でない整数

    • タイプ: int

    • デフォルト値: なし

    • 必須: はい

入力:

  • 1: 入力画像サイズ情報を提供する 3 つの要素 [image_height, image_width, scale_height_and_width] を持つ T タイプの 1D テンソル。必須。

  • 2: アンカーを提供する形状 [height * width * number_of_channels, 4] を持つタイプ T の 2D テンソル。必須。

  • 3: アンカーのデルタを提供する形状 [number_of_channels * 4, height, width] を持つタイプ T の 3D テンソル。3 番目と 4 番目の入力の高さと幅は同じである必要があります。必須。

  • 4: プロポーザルのスコアを提供する形状 [number_of_channels, height, width] を持つタイプ T の 3D テンソル。必須。

出力:

  • 1: ROI を提供する形状 [post_nms_count, 4] を持つタイプ T の 2D テンソル。

  • 2: ROI スコアを提供する形状 [post_nms_count] を持つタイプ T の 1D テンソル。

タイプ:

  • T: サポートされている浮動小数点タイプ。

例:

<layer ... type="ExperimentalDetectronGenerateProposalsSingleImage" version="opset6">
    <data min_size="0.0" nms_threshold="0.699999988079071" post_nms_count="1000" pre_nms_count="1000"/>
    <input>
        <port id="0">
            <dim>3</dim>
        </port>
        <port id="1">
            <dim>12600</dim>
            <dim>4</dim>
        </port>
        <port id="2">
            <dim>12</dim>
            <dim>50</dim>
            <dim>84</dim>
        </port>
        <port id="3">
            <dim>3</dim>
            <dim>50</dim>
            <dim>84</dim>
        </port>
    </input>
    <output>
        <port id="4" precision="FP32">
            <dim>1000</dim>
            <dim>4</dim>
        </port>
        <port id="5" precision="FP32">
            <dim>1000</dim>
        </port>
    </output>
</layer>