Hub 文档

使用 SetFit 与 Hugging Face

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

使用 SetFit 与 Hugging Face

SetFit 是一个高效且无需提示的框架,用于对 Sentence Transformers 进行少样本微调。它以少量标记数据实现高精度 - 例如,在 Customer Reviews 情感数据集上,每个类别仅使用 8 个标记示例,SetFit 的竞争力与在完整训练集(3k 个示例)上微调 RoBERTa Large 相当 🤯!

与其他少样本学习方法相比,SetFit 具有几个独特的功能

  • 🗣 无需提示或动词指示器: 当前的少样本微调技术需要手工制作的提示或动词指示器,以将示例转换为适合底层语言模型的格式。SetFit 完全放弃了提示,直接从文本示例生成丰富的嵌入。
  • 🏎 训练速度快: SetFit 不需要像 T0 或 GPT-3 这样的大规模模型即可实现高精度。因此,它的训练和运行推理速度通常快一个数量级(或更多)。
  • 🌎 多语言支持:SetFit 可以与 Hub 上的任何 Sentence Transformer 一起使用,这意味着您只需微调多语言检查点即可对多种语言的文本进行分类。

在 Hub 上探索 SetFit

您可以在模型页面的左侧进行筛选,找到 SetFit 模型。

Hub 上的所有模型都具有以下有用的功能

  1. 一个自动生成的模型卡片,其中包含简短的描述。
  2. 一个交互式小部件,您可以使用它直接在浏览器中试用模型。
  3. 一个 Inference API,允许您发出推理请求。

安装

要开始使用,您可以按照SetFit 安装指南进行操作。您也可以使用以下通过 pip 进行一键安装的命令

pip install -U setfit

使用现有模型

所有 setfit 模型都可以轻松地从 Hub 加载。

from setfit import SetFitModel

model = SetFitModel.from_pretrained("tomaarsen/setfit-paraphrase-mpnet-base-v2-sst2-8-shot")

加载后,您可以使用 SetFitModel.predict 执行推理。

model.predict("Amelia Earhart flew her single engine Lockheed Vega 5B across the Atlantic to Paris.")
['positive', 'negative']

如果您想加载特定的 SetFit 模型,可以点击 Use in SetFit,您将获得一个可用的代码片段!

其他资源

< > 在 GitHub 上更新