class torch_quantizer() - 3.5 简体中文

Vitis AI 用户指南 (UG1414)

Document ID
UG1414
Release Date
2023-09-28
Version
3.5 简体中文

torch_quantizer 类用于创建量化器对象:

class torch_quantizer(): 
  def __init__(self,
               quant_mode: str, # ['calib', 'test']
               module: torch.nn.Module,
               input_args: Union[torch.Tensor, Sequence[Any]] = None,
               state_dict_file: Optional[str] = None,
               output_dir: str = "quantize_result",
               bitwidth: int = 8,
               device: torch.device = torch.device("cuda"),
               quant_config_file: Optional[str] = None,
               target: Optional[str]=None): 

实参

Quant_mode
这是 1 个整数,表示此进程将使用的量化模式。calib 值用于校准量化,而 test 值则用于评估量化模型。
Module
要量化的浮点模块。
Input_args
此输入张量的形状与要量化的浮点模块的实际输入相同,但可取随机数值。
State_dict_file
用于对参数文件进行预训练的浮点模块。如果浮点模块已读入参数,则无需设置该参数。
Output_dir
量化结果和中间文件的目录。默认值为 quantize_result
Bitwidth
全局量化位宽。默认值为 8。
Device
在 GPU 或 CPU 上运行模型。
Quant_config_file
包含量化策略配置的 JSON 文件的位置。
Target
如果指定了目标器件,则会开启硬件感知量化。默认值为 None。