Optimum 文档

量化

您正在查看 主分支 版本,需要从源代码安装. 如果您想使用 pip 安装,请查看最新的稳定版本 (v1.23.1).
Hugging Face's logo
加入 Hugging Face 社区

并获得增强文档体验

开始

量化

FuriosaAIQuantizer

optimum.furiosa.FuriosaAIQuantizer

< >

( model_path: 路径 config: 可选 = 无 )

处理 huggingface.co/models 上共享模型的 FuriosaAI 量化过程。

compute_ranges

< >

( )

计算量化范围。

fit

< >

( dataset: 数据集 calibration_config: CalibrationConfig batch_size: int = 1 )

参数

  • dataset (数据集) — 用于执行校准步骤的数据集。
  • batch_size (int, 可选, 默认为 1) — 用于收集量化范围值的批次大小。

执行校准步骤并计算量化范围。

from_pretrained

< >

( model_or_path: Union file_name: Optional = None )

参数

  • model_or_path (Union[FuriosaAIModel, str, Path]) — 可以是:
    • 保存的导出 ONNX 中间表示 (IR) 模型的路径,例如:`./my_model_directory/`。
    • 或一个 FuriosaAIModelModelForXX 类,例如:FuriosaAIModelModelForImageClassification
  • file_name(Optional[str], 可选) — 将默认模型文件名从 "model.onnx" 覆盖到 file_name。这允许您从同一个库或目录加载不同的模型文件。

从模型路径实例化一个 FuriosaAIQuantizer

get_calibration_dataset

< >

( dataset_name: str num_samples: int = 100 dataset_config_name: Optional = None dataset_split: Optional = None preprocess_function: Optional = None preprocess_batch: bool = True seed: int = 2016 use_auth_token: bool = False )

参数

  • dataset_name (str) — Hugging Face Hub 上的数据集库名称或包含要加载用于校准步骤的数据文件的本地目录的路径。
  • num_samples (int, 可选, 默认为 100) — 组成校准数据集的样本最大数量。
  • dataset_config_name (Optional[str], 可选) — 数据集配置的名称。
  • dataset_split (Optional[str], 可选) — 要使用哪个数据集拆分来执行校准步骤。
  • preprocess_function (Optional[Callable], 可选) — 加载数据集后应用于每个示例的处理函数。
  • preprocess_batch (bool, 可选, 默认值: True) — preprocess_function 是否应该进行批处理。
  • seed (int, 可选, 默认值: 2016) — 打乱校准数据集时使用的随机种子。
  • use_auth_token (bool, 可选, 默认值: False) — 是否使用运行 transformers-cli login 时生成的令牌(对于某些数据集如 ImageNet 而言是必要的)。

创建用于训练后静态量化校准步骤的校准 datasets.Dataset

partial_fit

< >

( dataset: 数据集 calibration_config: CalibrationConfig batch_size: int = 1 )

参数

  • dataset (Dataset) — 用于执行校准步骤的数据集。
  • calibration_config (CalibrationConfig) — 包含与校准步骤相关的参数的配置。
  • batch_size (int, 可选, 默认值: 1) — 收集量化范围值时使用的批次大小。

执行校准步骤并收集量化范围,但不计算它们。

quantize

< >

( quantization_config: QuantizationConfig save_dir: Union file_suffix: Optional = 'quantized' calibration_tensors_range: Optional = None )

参数

  • quantization_config (QuantizationConfig) — 包含与量化相关的参数的配置。
  • file_suffix (Optional[str], 可选, 默认值为 "quantized") — 用于保存量化模型的文件后缀。
  • calibration_tensors_range (Optional[Dict[NodeName, Tuple[float, float]]], 可选) — 字典,将节点名称映射到它们的量化范围,仅在应用静态量化时使用和需要。

根据 quantization_config 中定义的优化规范量化模型。