SetFit 文档

SetFit

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

SetFit

🤗 SetFit 是一个高效且无需提示的框架,用于对 Sentence Transformers 进行少样本微调。它只需少量标注数据即可实现高精度——例如,在客户评论情感数据集上,每个类别仅用 8 个标注样本,🤗 SetFit 的表现就与在包含 3k 样本的完整训练集上微调 RoBERTa Large 不相上下!

与其他少量样本学习方法相比,SetFit 具有几个独特的特性

  • 🗣 无需提示或口语化: 当前的少样本微调技术需要手工制作提示或口语化器,将样本转换为适合底层语言模型的格式。SetFit 完全摒弃了提示,直接从文本样本生成丰富的嵌入。
  • 🏎 训练速度快: SetFit 无需像 T0、Llama 或 GPT-4 这样的大型模型即可实现高精度。因此,它的训练和推理速度通常快一个数量级(或更多)。
  • 🌎 多语言支持:SetFit 可以与 Hub 上的任何 Sentence Transformer 一起使用,这意味着您只需微调一个多语言检查点即可对多种语言的文本进行分类。
< > 在 GitHub 上更新