PEFT 集成
PEFT 的实际好处扩展到其他 Hugging Face 库,例如 Diffusers 和 Transformers。PEFT 的主要优势之一是,通过 PEFT 方法生成的适配器文件比原始模型小得多,这使得管理和使用多个适配器变得非常容易。您可以使用一个预训练的基模型执行多个任务,只需加载一个针对要解决的任务微调的新适配器即可。或者,您可以将多个适配器与文本到图像扩散模型结合使用,以创建新的效果。
本教程将向您展示 PEFT 如何帮助您在 Diffusers 和 Transformers 中管理适配器。
扩散模型
扩散模型是一个生成式 AI 库,用于使用扩散模型从文本或图像创建图像和视频。LoRA 是一种特别流行的扩散模型训练方法,因为您可以非常快速地训练和共享扩散模型以生成新风格的图像。为了更方便地使用和尝试多个 LoRA 模型,扩散模型使用 PEFT 库来帮助管理不同的适配器进行推理。
例如,加载一个基础模型,然后使用 artificialguybr/3DRedmond-V1 适配器进行推理,可以使用 load_lora_weights
方法。加载方法中的 adapter_name
参数由 PEFT 启用,允许您为适配器设置一个名称,以便更容易地进行引用。
import torch
from diffusers import DiffusionPipeline
pipeline = DiffusionPipeline.from_pretrained(
"stabilityai/stable-diffusion-xl-base-1.0", torch_dtype=torch.float16
).to("cuda")
pipeline.load_lora_weights(
"peft-internal-testing/artificialguybr__3DRedmond-V1",
weight_name="3DRedmond-3DRenderStyle-3DRenderAF.safetensors",
adapter_name="3d"
)
image = pipeline("sushi rolls shaped like kawaii cat faces").images[0]
image
现在让我们尝试另一个很酷的 LoRA 模型,ostris/super-cereal-sdxl-lora。您只需使用 adapter_name
加载并命名这个新的适配器,然后使用 set_adapters
方法将其设置为当前活动的适配器。
pipeline.load_lora_weights(
"ostris/super-cereal-sdxl-lora",
weight_name="cereal_box_sdxl_v1.safetensors",
adapter_name="cereal"
)
pipeline.set_adapters("cereal")
image = pipeline("sushi rolls shaped like kawaii cat faces").images[0]
image
最后,您可以调用 disable_lora
方法来恢复基础模型。
pipeline.disable_lora()
在 使用 PEFT 进行推理 教程中了解更多关于 PEFT 如何支持扩散模型的信息。
Transformers
🤗 Transformers 是一个包含所有类型任务的所有模态的预训练模型集合。您可以加载这些模型进行训练或推理。许多模型都是大型语言模型 (LLM),因此将 PEFT 与 Transformers 整合以管理和训练适配器很有意义。
加载一个基础预训练模型进行训练。
from transformers import AutoModelForCausalLM
model = AutoModelForCausalLM.from_pretrained("facebook/opt-350m")
接下来,添加一个适配器配置来指定如何调整模型参数。调用 add_adapter() 方法将配置添加到基础模型中。
from peft import LoraConfig
peft_config = LoraConfig(
lora_alpha=16,
lora_dropout=0.1,
r=64,
bias="none",
task_type="CAUSAL_LM"
)
model.add_adapter(peft_config)
现在,您可以使用 Transformer 的 Trainer 类或您喜欢的任何训练框架来训练模型。
要使用新训练的模型进行推理,AutoModel 类在后端使用 PEFT 将适配器权重和配置文件加载到基础预训练模型中。
from transformers import AutoModelForCausalLM
model = AutoModelForCausalLM.from_pretrained("peft-internal-testing/opt-350m-lora")
或者,您可以使用 transformers 的 Pipelines 来加载模型,以便方便地运行推理。
from transformers import pipeline
model = pipeline("text-generation", "peft-internal-testing/opt-350m-lora")
print(model("Hello World"))
如果您有兴趣比较或使用多个适配器,可以调用 add_adapter() 方法将适配器配置添加到基础模型中。唯一的要求是适配器类型必须相同(您不能混合 LoRA 和 LoHa 适配器)。
from transformers import AutoModelForCausalLM
from peft import LoraConfig
model = AutoModelForCausalLM.from_pretrained("facebook/opt-350m")
model.add_adapter(lora_config_1, adapter_name="adapter_1")
再次调用 add_adapter() 将新的适配器附加到基础模型。
model.add_adapter(lora_config_2, adapter_name="adapter_2")
然后,您可以使用 set_adapter() 来设置当前活动的适配器。
model.set_adapter("adapter_1")
output = model.generate(**inputs)
print(tokenizer.decode(output_disabled[0], skip_special_tokens=True))
要禁用适配器,请调用 disable_adapters 方法。
model.disable_adapters()
可以使用 enable_adapters 重新启用适配器。
如果您好奇,请查看 使用 PEFT 加载和训练适配器 教程以了解更多信息。
< > 在 GitHub 上更新