推理提供商文档
特征提取
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
特征提取
特征提取是将文本转换为向量(通常称为“嵌入”)的任务。
应用示例
- 检索与查询最相关的文档(用于 RAG 应用)。
- 根据文档与查询的相似性对文档列表进行重新排序。
- 计算两个句子之间的相似性。
有关
feature-extraction任务的更多详细信息,请查看其专用页面!您可以在其中找到示例和相关材料。
推荐模型
- thenlper/gte-large:一个强大的用于自然语言处理任务的特征提取模型。
在此处探索所有可用的模型,找到最适合您的模型。
使用 API
语言
客户端
提供商
import os
from huggingface_hub import InferenceClient
client = InferenceClient(
provider="hf-inference",
api_key=os.environ["HF_TOKEN"],
)
result = client.feature_extraction(
"Today is a sunny day and I will get some ice cream.",
model="intfloat/multilingual-e5-large",
)API 规范
请求
| 标头 | ||
|---|---|---|
| 授权 | 字符串 | 身份验证头,格式为 'Bearer: hf_****',其中 hf_**** 是具有“推理提供者”权限的个人用户访问令牌。您可以从您的设置页面生成一个。 |
| 有效负载 | ||
|---|---|---|
| inputs* | 未知 | 以下之一 |
| (#1) | 字符串 | |
| (#2) | 字符串数组 | |
| 归一化 | boolean | |
| prompt_name | 字符串 | 应用于编码的提示的名称。如果未设置,则不应用任何提示。必须是 sentence-transformers 配置 prompts 字典中的一个键。例如,如果 prompt_name 是“query”,并且 prompts 是 {“query”: “query: ”, …},那么句子“What is the capital of France?”将被编码为“query: What is the capital of France?”,因为提示文本将在编码任何文本之前被添加到前面。 |
| truncate | boolean | |
| truncation_direction | 枚举 | 可能的值:left, right。 |
响应
| 正文 | ||
|---|---|---|
| (数组) | 数组[] | 输出是一个数组的数组。 |