属性#

はじめに

名前

Target

Required

Mutable

AvgPoolPrecisionPreserved

Precision

No

Yes

IntervalsAlignment

Quantization interval

はい

Yes

PrecisionPreserved

Precision

Yes

Yes

Precisions

Precision

Yes

Yes

QuantizationAlignment

Quantization granularity

Yes

Yes

QuantizationGranularity

Quantization granularity

Yes

No

Target 属性グループは、最高のパフォーマンスを得るためモデル変換中の属性の使用法を定義します:

  • Precision - この属性は、最適な出力ポートの精度を定義します。

  • Quantization interval - この属性は量子化間隔を定義します。

  • Quantization alignment - この属性は、実行時の量子化の粒度 (チャネルごとまたはテンソルごとの量子化) を定義します。

  • Quantization granularity - この属性は、量子化の粒度 (チャネルごとまたはテンソルごとの量子化) を定義するためプラグインによって設定されます。

Required 属性グループは、変換中に最適なモデルを取得するため属性が必要かどうかを定義します。

  • Yes - この属性は、低精度の最適化のためすべての OpenVINO プラグインによって使用されます。

  • No - この属性は特定の OpenVINO プラグインで使用されます。

Mutable 属性グループは、変換で既存の属性を更新できるかどうかを定義します:

  • Yes - この属性は、パイプライン内の次の変換によって更新できます。ただし、属性の更新順序は依然として重要です。

  • No - 既存の属性は次の変換では更新できません。以前に処理された変換により、現在の値に従ってモデルが最適化されます。

FakeQuantize 分解は低精度変換の必須の部分です。分解中に使用される属性は必須です。オプションの属性は、特定の操作にのみ必要です。

変換による属性の使用:

属性名

変換によって作成

変換で使用

PrecisionPreserved

MarkupPrecisions、MarkupAvgPoolPrecisionPreserved

AlignQuantizationIntervals、AlignQuantizationParameters、 FakeQuantizeDecompositionTransformation、 MarkupAvgPoolPrecisionPreserved

AvgPoolPrecisionPreserved

MarkupAvgPoolPrecisionPreserved

Precisions

MarkupCanBeQuantized、 MarkupPrecisions

FakeQuantizeDecompositionTransformation

PerTensorQuantization

MarkupPerTensorQuantization

IntervalsAlignment

AlignQuantizationIntervals

FakeQuantizeDecompositionTransformation

QuantizationAlignment

AlignQuantizationParameters

FakeQuantizeDecompositionTransformation

同じタイプの属性インスタンスを異なる変換で作成できます。このアプローチは、変換の単一責任原則の結果です。例えば、Precision 属性インスタンスは MarkupCanBeQuantized 変換と MarkupPrecisions 変換で作成されますが、それらの作成理由は異なります。