量子化対応トレーニング (QAT)#
はじめに
量子化対応トレーニングは、モデルを量子化し、微調整を適用して量子化による精度低下を回復する一般的な方法です。実際、これは最も正確な量子化方法です。このドキュメントでは、ニューラル・ネットワーク圧縮フレームワーク (NNCF) から QAT を適用して 8 ビットの量子化モデルを取得する方法について説明します。Python プログラミングの知識があり、ソース DL フレームワークのモデルのトレーニング・コードに精通していることを前提としています。