优化
ORTOptimizer
class optimum.onnxruntime.ORTOptimizer
< 源代码 >( onnx_model_path: typing.List[os.PathLike] config: PretrainedConfig from_ortmodel: bool = False )
处理 Huggingface.co/models 上共享的模型的 ONNX Runtime 优化过程。
from_pretrained
< 源代码 >( model_or_path: typing.Union[str, os.PathLike, optimum.onnxruntime.modeling_ort.ORTModel] file_names: typing.Optional[typing.List[str]] = None )
参数
- model_or_path (
Union[str, os.PathLike, ORTModel]
) — 要优化的模型的本地目录路径或要量化的ORTModel
实例。 可以是以下之一:- 包含要优化的模型的本地目录的路径。
- ORTModel 的实例。
- file_names(
Optional[List[str]]
, 默认值为None
) — 要优化的模型的文件名列表。
get_fused_operators
< source >( onnx_model_path: typing.Union[str, os.PathLike] )
计算融合运算符名称与其在模型中出现次数的映射字典。
get_nodes_number_difference
< source >( onnx_model_path: typing.Union[str, os.PathLike] onnx_optimized_model_path: typing.Union[str, os.PathLike] )
计算原始模型和优化模型之间的节点数量差异。
get_operators_difference
< source >( onnx_model_path: typing.Union[str, os.PathLike] onnx_optimized_model_path: typing.Union[str, os.PathLike] )
计算运算符名称与其在原始模型和优化模型之间对应节点数量差异的映射字典。
optimize
< source >( optimization_config: OptimizationConfig save_dir: typing.Union[str, os.PathLike] file_suffix: typing.Optional[str] = 'optimized' use_external_data_format: typing.Optional[bool] = None one_external_file: bool = True )
根据 optimization_config
中定义的优化规范优化模型。