文本分类
文本分类是指为给定文本分配标签或类别的任务。一些用例包括情感分析、自然语言推理和评估语法正确性。
有关text-classification
任务的更多详细信息,请查看其专用页面!您会找到示例和相关资料。
推荐模型
- distilbert/distilbert-base-uncased-finetuned-sst-2-english:一个经过训练用于情感分析的稳健模型。
- ProsusAI/finbert:一个专门用于金融情感分析的情感分析模型。
- cardiffnlp/twitter-roberta-base-sentiment-latest:一个专门用于分析推文的情感分析模型。
- papluca/xlm-roberta-base-language-detection:可以对语言进行分类的模型。
- meta-llama/Prompt-Guard-86M:可以对文本生成攻击进行分类的模型。
探索所有可用的模型,找到最适合您的模型此处。
使用 API
Python
JavaScript
cURL
import requests
API_URL = "https://api-inference.huggingface.co/models/distilbert/distilbert-base-uncased-finetuned-sst-2-english"
headers = {"Authorization": "Bearer hf_***"}
def query(payload):
response = requests.post(API_URL, headers=headers, json=payload)
return response.json()
output = query({
"inputs": "I like you. I love you",
})
要使用 Python 客户端,请参阅huggingface_hub
的软件包参考。
API 规范
请求
有效负载 | ||
---|---|---|
inputs* | 字符串 | 要分类的文本 |
parameters | 对象 | 文本分类的其他推理参数 |
function_to_apply | 枚举 | 可能的值:sigmoid、softmax、none。 |
top_k | 整数 | 指定时,将输出限制为概率最高的 K 个类别。 |
可以通过将标头传递到推理 API 来配置一些选项。以下是可用的标头
标头 | ||
---|---|---|
authorization | 字符串 | 身份验证标头,格式为'Bearer: hf_****' ,其中hf_**** 是具有推理 API 权限的个人用户访问令牌。您可以从您的设置页面生成一个。 |
x-use-cache | 布尔值,默认为true | 推理 API 上有一层缓存层,用于加速我们已经处理过的请求。大多数模型都可以直接使用这些结果,因为它们是确定性的(这意味着输出始终相同)。但是,如果您使用非确定性模型,则可以设置此参数以阻止使用缓存机制,从而生成一个全新的查询。有关缓存的更多信息,请点击此处。 |
x-wait-for-model | 布尔值,默认为 false | 如果模型未就绪,则等待模型就绪,而不是收到 503 错误。这可以减少获取推理结果所需的请求数量。建议仅在收到 503 错误后才将此标志设置为 true,因为它可以将应用程序挂起限制在已知位置。有关模型可用性的更多信息,请点击此处。 |
有关推理 API 标头的更多信息,请查看参数指南。
响应
主体 | ||
---|---|---|
(数组) | object[] | 输出是一个对象数组。 |
标签 | 字符串 | 预测的类别标签。 |
得分 | 数字 | 相应的概率。 |