在 Hugging Face 中使用 SetFit

SetFit 是一个高效且无需提示词（prompt-free）的框架，用于对 Sentence Transformers 进行少样本微调。它只需少量标注数据即可实现高精度——例如，在客户评论情感数据集上，每个类别仅使用 8 个标注样本，SetFit 的性能就可与在 3000 个样本的完整训练集上微调的 RoBERTa Large 相媲美 🤯！

与其他少量样本学习方法相比，SetFit 具有几个独特的特性

🗣 无需提示词或转换器（verbalizers）： 当前的少样本微调技术需要手工制作提示词或转换器，将样本转换为适合底层语言模型的格式。SetFit 完全摒弃了提示词，通过直接从文本样本中生成丰富的嵌入向量来实现。
🏎 训练速度快： SetFit 无需像 T0 或 GPT-3 这样的大规模模型也能实现高精度。因此，其训练和推理速度通常快一个数量级（或更多）。
🌎 多语言支持：SetFit 可以与 Hub 上的任何 Sentence Transformer 模型一起使用，这意味着你只需微调一个多语言检查点，就可以对多种语言的文本进行分类。

在 Hub 上探索 SetFit

你可以在模型页面左侧进行筛选，找到 SetFit 模型。

Hub 上的所有模型都具有以下实用功能：

自动生成的模型卡片，包含简要描述。
一个交互式小部件，您可以在浏览器中直接使用模型进行操作。
一个推理 API，允许您发出推理请求。

安装

首先，你可以按照 SetFit 安装指南进行操作。你也可以通过 pip 使用以下单行命令安装：

pip install -U setfit

使用现有模型

所有 setfit 模型都可以轻松地从 Hub 加载。

from setfit import SetFitModel

model = SetFitModel.from_pretrained("tomaarsen/setfit-paraphrase-mpnet-base-v2-sst2-8-shot")

加载后，你可以使用 SetFitModel.predict 进行推理。

model.predict("Amelia Earhart flew her single engine Lockheed Vega 5B across the Atlantic to Paris.")

['positive', 'negative']

如果你想加载一个特定的 SetFit 模型，可以点击“在 SetFit 中使用（Use in SetFit）”，系统会提供一个可用的代码片段！

其他资源

< > 在 GitHub 上更新