Hub 文档

在 Hugging Face 中使用 SetFit

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

在 Hugging Face 中使用 SetFit

SetFit 是一个高效且无需提示词(prompt-free)的框架,用于对 Sentence Transformers 进行少样本微调。它只需少量标注数据即可实现高精度——例如,在客户评论情感数据集上,每个类别仅使用 8 个标注样本,SetFit 的性能就可与在 3000 个样本的完整训练集上微调的 RoBERTa Large 相媲美 🤯!

与其他少量样本学习方法相比,SetFit 具有几个独特的特性

  • 🗣 无需提示词或转换器(verbalizers): 当前的少样本微调技术需要手工制作提示词或转换器,将样本转换为适合底层语言模型的格式。SetFit 完全摒弃了提示词,通过直接从文本样本中生成丰富的嵌入向量来实现。
  • 🏎 训练速度快: SetFit 无需像 T0 或 GPT-3 这样的大规模模型也能实现高精度。因此,其训练和推理速度通常快一个数量级(或更多)。
  • 🌎 多语言支持:SetFit 可以与 Hub 上的任何 Sentence Transformer 模型一起使用,这意味着你只需微调一个多语言检查点,就可以对多种语言的文本进行分类。

在 Hub 上探索 SetFit

你可以在模型页面左侧进行筛选,找到 SetFit 模型。

Hub 上的所有模型都具有以下实用功能:

  1. 自动生成的模型卡片,包含简要描述。
  2. 一个交互式小部件,您可以在浏览器中直接使用模型进行操作。
  3. 一个推理 API,允许您发出推理请求。

安装

首先,你可以按照 SetFit 安装指南进行操作。你也可以通过 pip 使用以下单行命令安装:

pip install -U setfit

使用现有模型

所有 setfit 模型都可以轻松地从 Hub 加载。

from setfit import SetFitModel

model = SetFitModel.from_pretrained("tomaarsen/setfit-paraphrase-mpnet-base-v2-sst2-8-shot")

加载后,你可以使用 SetFitModel.predict 进行推理。

model.predict("Amelia Earhart flew her single engine Lockheed Vega 5B across the Atlantic to Paris.")
['positive', 'negative']

如果你想加载一个特定的 SetFit 模型,可以点击“在 SetFit 中使用(Use in SetFit)”,系统会提供一个可用的代码片段!

其他资源

< > 在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.