Optimum 文档
量化
并获得增强的文档体验
开始使用
量化
FuriosaAIQuantizer
class optimum.furiosa.FuriosaAIQuantizer
< 源代码 >( model_path: Path config: typing.Optional[ForwardRef('PretrainedConfig')] = None )
处理在 huggingface.co/models 上共享的模型的 FuriosaAI 量化过程。
计算量化范围。
fit
< 源代码 >( dataset: Dataset calibration_config: CalibrationConfig batch_size: int = 1 )
参数
- dataset (
Dataset
) — 用于执行校准步骤的数据集。 - calibration_config (~CalibrationConfig) — 包含与校准步骤相关的参数的配置。
- batch_size (
int
, optional, defaults to 1) — 在收集量化范围值时使用的批量大小。
执行校准步骤并计算量化范围。
from_pretrained
< 源代码 >( model_or_path: typing.Union[ForwardRef('FuriosaAIQuantizer'), str, pathlib.Path] file_name: typing.Optional[str] = None )
从模型路径实例化 FuriosaAIQuantizer
。
get_calibration_dataset
< 源代码 >( dataset_name: str num_samples: int = 100 dataset_config_name: typing.Optional[str] = None dataset_split: typing.Optional[str] = None preprocess_function: typing.Optional[typing.Callable] = None preprocess_batch: bool = True seed: int = 2016 use_auth_token: bool = False )
参数
- dataset_name (
str
) — Hugging Face Hub 上的数据集存储库名称或包含要加载的数据文件以用于校准步骤的本地目录的路径。 - num_samples (
int
, optional, defaults to 100) — 构成校准数据集的最大样本数量。 - dataset_config_name (
Optional[str]
, optional) — 数据集配置的名称。 - dataset_split (
Optional[str]
, optional) — 要使用数据集的哪个划分来执行校准步骤。 - preprocess_function (
Optional[Callable]
, optional) — 加载数据集后应用于每个示例的处理函数。 - preprocess_batch (
bool
, optional, defaults toTrue
) —preprocess_function
是否应该分批处理。 - seed (
int
, optional, defaults to 2016) — 在对校准数据集进行洗牌时使用的随机种子。 - use_auth_token (
bool
, optional, defaults toFalse
) — 是否使用运行transformers-cli login
时生成的令牌(对于某些数据集(如 ImageNet)是必需的)。
创建用于训练后静态量化校准步骤的校准 datasets.Dataset
。
partial_fit
< 源代码 >( dataset: Dataset calibration_config: CalibrationConfig batch_size: int = 1 )
执行校准步骤并收集量化范围,但不计算它们。
quantize
< 源代码 >( quantization_config: QuantizationConfig save_dir: typing.Union[str, pathlib.Path] file_suffix: typing.Optional[str] = 'quantized' calibration_tensors_range: typing.Optional[typing.Dict[str, typing.Tuple[float, float]]] = None )
根据 quantization_config
中定义的优化规范来量化模型。