推理提供商文档
特征提取
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
特征提取
特征提取是将文本转换为向量(通常称为“嵌入”)的任务。
应用示例
- 为查询检索最相关的文档(用于 RAG 应用)。
- 根据文档与查询的相似性重新排序文档列表。
- 计算两个句子之间的相似性。
有关 feature-extraction
任务的更多详细信息,请查看其专用页面!您将找到示例和相关材料。
推荐模型
- thenlper/gte-large:用于自然语言处理任务的强大特征提取模型。
在此处探索所有可用模型并找到最适合您的模型。
使用 API
语言
客户端
提供商
import os
from huggingface_hub import InferenceClient
client = InferenceClient(
provider="hf-inference",
api_key=os.environ["HF_TOKEN"],
)
result = client.feature_extraction(
"Today is a sunny day and I will get some ice cream.",
model="intfloat/multilingual-e5-large",
)
API 规范
请求
标头 | ||
---|---|---|
授权 | 字符串 | 身份验证头,格式为 'Bearer: hf_****' ,其中 hf_**** 是具有“Inference Providers”权限的个人用户访问令牌。您可以在您的设置页面生成一个。 |
有效负载 | ||
---|---|---|
输入* | 未知 | 以下之一 |
(#1) | 字符串 | |
(#2) | 字符串数组 | |
归一化 | 布尔值 | |
prompt_name | 字符串 | 用于编码的提示名称。如果未设置,则不应用提示。必须是 sentence-transformers 配置 prompts 字典中的一个键。例如,如果 prompt_name 是“query”,并且 prompts 是 {“query”: “query: ”,…},那么句子“What is the capital of France?”将被编码为“query: What is the capital of France?”,因为提示文本将在任何要编码的文本之前添加。 |
截断 | 布尔值 | |
截断方向 | 枚举 | 可能的值:Left,Right。 |
响应
正文 | ||
---|---|---|
(数组) | 数组[] | 输出是一个数组的数组。 |