ConvolutionTransformation 変換¶
ov::pass::low_precision::ConvolutionTransformation クラスは、Convolution 操作の変換を表します。
変換は、畳み込み操作を通じてアクティベーションと重みに対する逆量子化演算を伝播します。この変換では、いくつかの重み量子化アプローチがサポートされています。
逆量子化操作による低精度の量子化重み
FakeQuantize 操作による元の精度の重み
乗算定数値の結果は、アクティベーション a に対する逆量子化の乗算定数値と重み b に対する逆量子化の乗算定数値の乗算として計算されます。
\[result_{i} = a_{i} \cdot b_{i}\]
制限事項¶
アクティベーション時の逆量子化はテンソルごとに行う必要があります。これは、アクティベーション時の逆量子化乗算定数値がスカラーでなければならないことを意味します。