class torch_quantizer() - 3.0 简体中文

Vitis AI 用户指南 (UG1414)

Document ID
UG1414
Release Date
2023-02-24
Version
3.0 简体中文

torch_quantizer 用于创建量化器对象。

class torch_quantizer(): 
  def __init__(self,
               quant_mode: str, # ['calib', 'test']
               module: torch.nn.Module,
               input_args: Union[torch.Tensor, Sequence[Any]] = None,
               state_dict_file: Optional[str] = None,
               output_dir: str = "quantize_result",
               bitwidth: int = 8,
               device: torch.device = torch.device("cuda"),
               quant_config_file: Optional[str] = None,
               target: Optional[str]=None): 

实参

Quant_mode
这是 1 个整数,表示此进程将使用的量化模式。“calib”表示量化校准,“test”则表示量化模型的求值。
Module
要量化的浮点模块。
Input_args
输入张量,形状与要量化的浮点模块的真实输入相同,但值可为随机数值。
State_dict_file
用于对参数文件进行预训练的浮点模块。如果浮点模块已读入参数,则无需设置该参数。
Output_dir
量化结果和中间文件的目录。默认设置为“quantize_result”。
Bitwidth
全局量化位宽。默认值为 8。
Device
在 GPU 或 CPU 上运行模型。
Quant_config_file
用于量化策略配置的 JSON 文件路径。
Target
如果指定了目标器件,则会开启硬件感知量化。默认值为 None。