SetFit 文档
SetFit
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
SetFit
🤗 SetFit 是一个高效且无需提示的框架,用于 Sentence Transformers 的少样本微调。它以少量标记数据实现高精度 - 例如,在 Customer Reviews 情感数据集上,每个类别仅使用 8 个标记示例,🤗 SetFit 的性能就可以与在 3k 个示例的完整训练集上微调 RoBERTa Large 相媲美!
与其他少样本学习方法相比,SetFit 具有几个独特的功能
- 🗣 无需提示或口语化器: 当前的少样本微调技术需要手工制作提示或口语化器,以将示例转换为适用于底层语言模型的格式。SetFit 通过直接从文本示例生成丰富的嵌入,从而完全省去了提示。
- 🏎 训练速度快: SetFit 不需要像 T0、Llama 或 GPT-4 这样的大型模型即可实现高精度。因此,它的训练和运行推理通常快一个数量级(或更多)。
- 🌎 多语言支持:SetFit 可以与 Hub 上的任何 Sentence Transformer 一起使用,这意味着您只需微调多语言检查点即可对多种语言的文本进行分类。
< > 在 GitHub 上更新