Hub 文档

在 Hugging Face Hub 上使用 Sentence Transformers

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

在 Hugging Face 上使用 Sentence Transformers

sentence-transformers 是一个库,它提供了计算句子、段落和图像嵌入(密集向量表示)的简单方法。文本被嵌入到向量空间中,使得相似的文本彼此靠近,从而实现语义搜索、聚类和检索等应用。

探索 Hub 中的 sentence-transformers

您可以通过在模型页面左侧进行筛选,找到 500 多个 sentence-transformer 模型。这些模型中的大多数都支持不同的任务,例如进行 feature-extraction 以生成嵌入,以及 sentence-similarity 作为确定给定句子与其他句子相似度的方法。您还可以在官方文档中找到官方预训练模型的概览。

Hub 上的所有模型都具有以下功能:

  1. 自动生成的模型卡片,包含描述、示例代码片段、架构概览等。
  2. 元数据标签,有助于发现并包含许可等信息。
  3. 可直接在浏览器中与模型交互的交互式小部件。
  4. 允许进行推理请求的推理 API。

使用现有模型

Hub 上的预训练模型可以通过一行代码加载:

from sentence_transformers import SentenceTransformer
model = SentenceTransformer('model_name')

这是一个对句子进行编码,然后计算它们之间距离以进行语义搜索的示例。

from sentence_transformers import SentenceTransformer, util
model = SentenceTransformer('multi-qa-MiniLM-L6-cos-v1')

query_embedding = model.encode('How big is London')
passage_embedding = model.encode(['London has 9,787,426 inhabitants at the 2011 census',
                                  'London is known for its finacial district'])

print("Similarity:", util.dot_score(query_embedding, passage_embedding))

如果您想了解如何加载特定模型,可以点击 Use in sentence-transformers,您将获得一个可供加载的工作代码片段!

分享您的模型

您可以使用训练好的模型的 save_to_hub 方法来分享您的 Sentence Transformers 模型。

from sentence_transformers import SentenceTransformer

# Load or train a model
model.save_to_hub("my_new_model")

此命令将创建一个包含自动生成的模型卡片、推理小部件、示例代码片段等功能的仓库!此处为一个示例。

其他资源

  • Sentence Transformers
  • Sentence Transformers 文档
  • 与 Hub 的集成公告
< > 在 GitHub 上更新