推理提供商文档

Token 分类

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

词元分类

词元分类是一项任务,它将标签分配给文本中的某些词元。一些流行的词元分类子任务是命名实体识别 (NER) 和词性标注 (PoS)。

有关 `token-classification` 任务的更多详细信息,请查看其专用页面!您将找到示例和相关材料。

推荐模型

在此处探索所有可用模型,找到最适合您的模型。

使用 API

import os
from huggingface_hub import InferenceClient

client = InferenceClient(
    provider="hf-inference",
    api_key=os.environ["HF_TOKEN"],
)

result = client.token_classification(
    "My name is Sarah Jessica Parker but you can call me Jessica",
    model="dslim/bert-base-NER",
)

API 规范

请求

标头
授权 字符串 认证头采用 `Bearer: hf_****` 形式,其中 `hf_****` 是具有“推理提供商”权限的个人用户访问令牌。您可以从您的设置页面生成一个。
有效负载
输入* 字符串 输入文本数据
参数 对象
        ignore_labels 字符串数组 要忽略的标签列表
        stride 整数 分割输入文本时,块之间重叠词元的数量。
        aggregation_strategy 字符串 以下之一
                 (#1) “无” 不聚合词元
                 (#2) “简单” 将具有相同标签的连续词元分组为单个实体。
                 (#3) “第一个” 类似于“简单”,也保留单词完整性(使用单词中第一个词元预测的标签)。
                 (#4) “平均” 类似于“简单”,也保留单词完整性(使用得分最高的标签,在单词词元中取平均)。
                 (#5) “最大” 类似于“简单”,也保留单词完整性(使用单词词元中得分最高的标签)。

响应

正文
(数组) 对象数组 输出是一个对象数组。
        entity_group 字符串 一组或多个词元的预测标签
        entity 字符串 单个词元的预测标签
        score 数字 相关得分/概率
        word 字符串 对应的文本
        start 整数 此组在输入中的起始字符位置。
        end 整数 此组在输入中的结束字符位置。
< > 在 GitHub 上更新