Optimum 文档

优化

您正在查看 main 版本,该版本需要从源码安装。如果您想要常规 pip 安装,请查看最新的稳定版本 (v1.24.0)。
Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

优化

ORTOptimizer

class optimum.onnxruntime.ORTOptimizer

< >

( onnx_model_path: typing.List[os.PathLike] config: PretrainedConfig from_ortmodel: bool = False )

处理在 huggingface.co/models 上共享的模型的 ONNX Runtime 优化过程。

from_pretrained

< >

( model_or_path: typing.Union[str, os.PathLike, optimum.onnxruntime.modeling_ort.ORTModel] file_names: typing.Optional[typing.List[str]] = None )

参数

  • model_or_path (Union[str, os.PathLike, ORTModel]) — 要优化的模型的本地目录路径,或 ORTModel 的实例以进行量化。可以是:
    • 包含要优化模型的本地目录的路径。
    • ORTModel 的实例。
  • file_names(Optional[List[str]], 默认为 None) — 要优化的模型的文件名列表。

get_fused_operators

< >

( onnx_model_path: typing.Union[str, os.PathLike] )

参数

  • onnx_model_path (Union[str, os.PathLike]) — ONNX 模型的路径。

计算字典,该字典将融合算子的名称映射到它们在模型中出现的次数。

get_nodes_number_difference

< >

( onnx_model_path: typing.Union[str, os.PathLike] onnx_optimized_model_path: typing.Union[str, os.PathLike] )

参数

  • onnx_model_path (Union[str, os.PathLike]) — ONNX 模型的路径。
  • onnx_optimized_model_path (Union[str, os.PathLike]) — 优化后的 ONNX 模型的路径。

计算原始模型和优化模型之间节点数量的差异。

get_operators_difference

< >

( onnx_model_path: typing.Union[str, os.PathLike] onnx_optimized_model_path: typing.Union[str, os.PathLike] )

参数

  • onnx_model_path (Union[str, os.PathLike]) — ONNX 模型的路径。
  • onnx_optimized_model_path (Union[str, os.PathLike]) — 优化后的 ONNX 模型的路径。

计算字典,该字典将算子名称映射到原始模型和优化模型之间相应节点数量的差异。

optimize

< >

( optimization_config: OptimizationConfig save_dir: typing.Union[str, os.PathLike] file_suffix: typing.Optional[str] = 'optimized' use_external_data_format: typing.Optional[bool] = None one_external_file: bool = True )

参数

  • optimization_config (OptimizationConfig) — 包含与优化相关的参数的配置。
  • save_dir (Union[str, os.PathLike]) — 用于保存优化模型的路径。
  • file_suffix (str, 默认为 "optimized") — 用于保存优化模型的文件后缀。
  • use_external_data_format (Optional[bool], 默认为 None) — 是否使用外部数据格式存储大小 >= 2Gb 的模型。此参数已弃用。
  • one_external_file (bool, 默认为 True) — 当 use_external_data_format=True 时,是否将所有张量保存到一个外部文件。如果为 False,则将每个张量保存到一个以张量名称命名的文件中。

根据 optimization_config 中定义的优化规范来优化模型。

< > 在 GitHub 上更新