Hub 文档

在 Hugging Face 上使用 Sentence Transformers

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

在 Hugging Face 上使用 Sentence Transformers

sentence-transformers 是一个库,它提供了计算句子、段落和图像的嵌入(密集向量表示)的简便方法。文本被嵌入到向量空间中,使得相似的文本彼此靠近,从而实现语义搜索、聚类和检索等应用。

在 Hub 中探索 sentence-transformers

您可以通过在模型页面的左侧进行筛选,找到超过五百个 sentence-transformer 模型。这些模型大多数支持不同的任务,例如执行 feature-extraction 以生成嵌入,以及 sentence-similarity 作为确定给定句子与其他句子相似程度的方法。您还可以在官方文档中找到官方预训练模型的概述。

Hub 上的所有模型都带有以下功能

  1. 自动生成的模型卡片,其中包含描述、示例代码片段、架构概述等。
  2. 元数据标签,有助于发现性,并包含许可证等信息。
  3. 交互式小部件,您可以使用它直接在浏览器中试用模型。
  4. 允许发出推理请求的 Inference API。

使用现有模型

Hub 上的预训练模型可以用一行代码加载

from sentence_transformers import SentenceTransformer
model = SentenceTransformer('model_name')

这是一个示例,它编码句子,然后计算它们之间的距离以进行语义搜索。

from sentence_transformers import SentenceTransformer, util
model = SentenceTransformer('multi-qa-MiniLM-L6-cos-v1')

query_embedding = model.encode('How big is London')
passage_embedding = model.encode(['London has 9,787,426 inhabitants at the 2011 census',
                                  'London is known for its finacial district'])

print("Similarity:", util.dot_score(query_embedding, passage_embedding))

如果您想查看如何加载特定模型,可以单击“Use in sentence-transformers”,您将获得一个可用的代码片段,您可以加载它!

分享您的模型

您可以使用已训练模型的 save_to_hub 方法来分享您的 Sentence Transformers 模型。

from sentence_transformers import SentenceTransformer

# Load or train a model
model.save_to_hub("my_new_model")

此命令将创建一个仓库,其中包含自动生成的模型卡片、推理小部件、示例代码片段等!这里是一个示例。

其他资源

  • Sentence Transformers
  • Sentence Transformers 文档
  • 与 Hub 集成公告
< > 在 GitHub 上更新