DeepSpeed 相关的辅助程序
类 accelerate.DeepSpeedPlugin
< 源代码 >( hf_ds_config: Any = None gradient_accumulation_steps: int = None gradient_clipping: float = None zero_stage: int = None is_train_batch_min: bool = True offload_optimizer_device: str = None offload_param_device: str = None offload_optimizer_nvme_path: str = None offload_param_nvme_path: str = None zero3_init_flag: bool = None zero3_save_16bit_model: bool = None transformer_moe_cls_names: str = None )
此插件用于整合 DeepSpeed。
运用 kwargs 中的值来处理 DeepSpeed 配置。
类别 accelerate.utils.虚拟优化
< 源代码 >( 参数 学习率 = 0.001 权重衰减 = 0 **kwargs )
虚拟优化器表示模型参数或参数组,这主要用于在 deepspeed 配置文件中指定优化器配置时遵循传统训练循环。
类 accelerate.utils.DummyScheduler
< 源 >( optimizer total_num_steps = None warmup_num_steps = 0 lr_scheduler_callable = None **kwargs )
虚拟调度器提供模型参数或参数组,这主要用于在 deepspeed 配置文件指定调度器配置时遵循常规训练循环。
class accelerate.utils.DeepSpeedEngineWrapper
< 源代码 >( engine )
deepspeed.runtime.engine.DeepSpeedEngine 的内部封装器。用于遵循常规训练循环。
类别 accelerate.utils.DeepSpeedOptimizerWrapper
< 源代码 >( optimizer )
Deepspeed 优化器的内部包装器。
类 accelerate.utils.DeepSpeedSchedulerWrapper
< 源代码 >( scheduler optimizers )
用于 deepspeed 调度程序的内部封装。