Hub 文档
使用 SetFit 与 Hugging Face
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
使用 SetFit 与 Hugging Face
SetFit 是一个高效且无需提示的框架,用于对 Sentence Transformers 进行少样本微调。它以少量标记数据实现高精度 - 例如,在 Customer Reviews 情感数据集上,每个类别仅使用 8 个标记示例,SetFit 的竞争力与在完整训练集(3k 个示例)上微调 RoBERTa Large 相当 🤯!
与其他少样本学习方法相比,SetFit 具有几个独特的功能
- 🗣 无需提示或动词指示器: 当前的少样本微调技术需要手工制作的提示或动词指示器,以将示例转换为适合底层语言模型的格式。SetFit 完全放弃了提示,直接从文本示例生成丰富的嵌入。
- 🏎 训练速度快: SetFit 不需要像 T0 或 GPT-3 这样的大规模模型即可实现高精度。因此,它的训练和运行推理速度通常快一个数量级(或更多)。
- 🌎 多语言支持:SetFit 可以与 Hub 上的任何 Sentence Transformer 一起使用,这意味着您只需微调多语言检查点即可对多种语言的文本进行分类。
在 Hub 上探索 SetFit
您可以在模型页面的左侧进行筛选,找到 SetFit 模型。
Hub 上的所有模型都具有以下有用的功能
- 一个自动生成的模型卡片,其中包含简短的描述。
- 一个交互式小部件,您可以使用它直接在浏览器中试用模型。
- 一个 Inference API,允许您发出推理请求。
安装
要开始使用,您可以按照SetFit 安装指南进行操作。您也可以使用以下通过 pip 进行一键安装的命令
pip install -U setfit
使用现有模型
所有 setfit
模型都可以轻松地从 Hub 加载。
from setfit import SetFitModel
model = SetFitModel.from_pretrained("tomaarsen/setfit-paraphrase-mpnet-base-v2-sst2-8-shot")
加载后,您可以使用 SetFitModel.predict
执行推理。
model.predict("Amelia Earhart flew her single engine Lockheed Vega 5B across the Atlantic to Paris.")
['positive', 'negative']
如果您想加载特定的 SetFit 模型,可以点击 Use in SetFit
,您将获得一个可用的代码片段!
其他资源
- Hub 上提供的所有 SetFit 模型
- SetFit 仓库
- SetFit 文档
- SetFit 论文