Token 分类 - Hugging Face 文档

词元分类

词元分类是一项任务，它将标签分配给文本中的某些词元。一些流行的词元分类子任务是命名实体识别 (NER) 和词性标注 (PoS)。

有关 `token-classification` 任务的更多详细信息，请查看其专用页面！您将找到示例和相关材料。

使用 API

语言

客户端

提供商

设置

import os
from huggingface_hub import InferenceClient

client = InferenceClient(
    provider="hf-inference",
    api_key=os.environ["HF_TOKEN"],
)

result = client.token_classification(
    "My name is Sarah Jessica Parker but you can call me Jessica",
    model="dslim/bert-base-NER",
)

API 规范

请求

标头
授权	字符串	认证头采用 `Bearer: hf_**` 形式，其中 `hf_**` 是具有“推理提供商”权限的个人用户访问令牌。您可以从您的设置页面生成一个。

有效负载
输入*	字符串	输入文本数据
参数	对象
ignore_labels	字符串数组	要忽略的标签列表
stride	整数	分割输入文本时，块之间重叠词元的数量。
aggregation_strategy	字符串	以下之一
(#1)	“无”	不聚合词元
(#2)	“简单”	将具有相同标签的连续词元分组为单个实体。
(#3)	“第一个”	类似于“简单”，也保留单词完整性（使用单词中第一个词元预测的标签）。
(#4)	“平均”	类似于“简单”，也保留单词完整性（使用得分最高的标签，在单词词元中取平均）。
(#5)	“最大”	类似于“简单”，也保留单词完整性（使用单词词元中得分最高的标签）。

响应

正文
（数组）	对象数组	输出是一个对象数组。
entity_group	字符串	一组或多个词元的预测标签
entity	字符串	单个词元的预测标签
score	数字	相关得分/概率
word	字符串	对应的文本
start	整数	此组在输入中的起始字符位置。
end	整数	此组在输入中的结束字符位置。

< > 在 GitHub 上更新

推理服务提供商

词元分类

推荐模型

使用 API

API 规范

请求

响应