推理提供商文档
Token 分类
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
词元分类
词元分类是一项任务,它将标签分配给文本中的某些词元。一些流行的词元分类子任务是命名实体识别 (NER) 和词性标注 (PoS)。
有关 `token-classification` 任务的更多详细信息,请查看其专用页面!您将找到示例和相关材料。
推荐模型
- dslim/bert-base-NER:一个性能强大的模型,用于识别人物、地点、组织和各种实体名称。
- FacebookAI/xlm-roberta-large-finetuned-conll03-english:一个强大的模型,用于识别多种语言中的人物、地点、组织和名称。
- blaze999/Medical-NER:一个专门用于医学实体识别的词元分类模型。
在此处探索所有可用模型,找到最适合您的模型。
使用 API
语言
客户端
提供商
import os
from huggingface_hub import InferenceClient
client = InferenceClient(
provider="hf-inference",
api_key=os.environ["HF_TOKEN"],
)
result = client.token_classification(
"My name is Sarah Jessica Parker but you can call me Jessica",
model="dslim/bert-base-NER",
)
API 规范
请求
标头 | ||
---|---|---|
授权 | 字符串 | 认证头采用 `Bearer: hf_****` 形式,其中 `hf_****` 是具有“推理提供商”权限的个人用户访问令牌。您可以从您的设置页面生成一个。 |
有效负载 | ||
---|---|---|
输入* | 字符串 | 输入文本数据 |
参数 | 对象 | |
ignore_labels | 字符串数组 | 要忽略的标签列表 |
stride | 整数 | 分割输入文本时,块之间重叠词元的数量。 |
aggregation_strategy | 字符串 | 以下之一 |
(#1) | “无” | 不聚合词元 |
(#2) | “简单” | 将具有相同标签的连续词元分组为单个实体。 |
(#3) | “第一个” | 类似于“简单”,也保留单词完整性(使用单词中第一个词元预测的标签)。 |
(#4) | “平均” | 类似于“简单”,也保留单词完整性(使用得分最高的标签,在单词词元中取平均)。 |
(#5) | “最大” | 类似于“简单”,也保留单词完整性(使用单词词元中得分最高的标签)。 |
响应
正文 | ||
---|---|---|
(数组) | 对象数组 | 输出是一个对象数组。 |
entity_group | 字符串 | 一组或多个词元的预测标签 |
entity | 字符串 | 单个词元的预测标签 |
score | 数字 | 相关得分/概率 |
word | 字符串 | 对应的文本 |
start | 整数 | 此组在输入中的起始字符位置。 |
end | 整数 | 此组在输入中的结束字符位置。 |