推理提供商文档

特征提取

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

特征提取

特征提取是将文本转换为向量(通常称为“嵌入”)的任务。

应用示例

  • 检索与查询最相关的文档(用于 RAG 应用)。
  • 根据文档与查询的相似性对文档列表进行重新排序。
  • 计算两个句子之间的相似性。

有关 feature-extraction 任务的更多详细信息,请查看其专用页面!您可以在其中找到示例和相关材料。

推荐模型

  • thenlper/gte-large:一个强大的用于自然语言处理任务的特征提取模型。

在此探索所有可用的模型,找到最适合您的模型。

使用 API

import os
from huggingface_hub import InferenceClient

client = InferenceClient(
    provider="hf-inference",
    api_key=os.environ["HF_TOKEN"],
)

result = client.feature_extraction(
    "Today is a sunny day and I will get some ice cream.",
    model="intfloat/multilingual-e5-large",
)

API 规范

请求

标头
授权 字符串 身份验证头,格式为 'Bearer: hf_****',其中 hf_**** 是具有“推理提供者”权限的个人用户访问令牌。您可以从您的设置页面生成一个。
有效负载
inputs* 未知 以下之一
         (#1) 字符串
         (#2) 字符串数组
归一化 boolean
prompt_name 字符串 应用于编码的提示的名称。如果未设置,则不应用任何提示。必须是 sentence-transformers 配置 prompts 字典中的一个键。例如,如果 prompt_name 是“query”,并且 prompts 是 {“query”: “query: ”, …},那么句子“What is the capital of France?”将被编码为“query: What is the capital of France?”,因为提示文本将在编码任何文本之前被添加到前面。
truncate boolean
truncation_direction 枚举 可能的值:left, right。

响应

正文
(数组) 数组[] 输出是一个数组的数组。
在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.