在 Hugging Face 上使用 Sentence Transformers

sentence-transformers 是一个库，它提供了计算句子、段落和图像嵌入（密集向量表示）的简单方法。文本被嵌入到向量空间中，使得相似的文本彼此靠近，从而实现语义搜索、聚类和检索等应用。

探索 Hub 中的 sentence-transformers

您可以通过在模型页面左侧进行筛选，找到 500 多个 sentence-transformer 模型。这些模型中的大多数都支持不同的任务，例如进行 feature-extraction 以生成嵌入，以及 sentence-similarity 作为确定给定句子与其他句子相似度的方法。您还可以在官方文档中找到官方预训练模型的概览。

Hub 上的所有模型都具有以下功能：

自动生成的模型卡片，包含描述、示例代码片段、架构概览等。
元数据标签，有助于发现并包含许可等信息。
可直接在浏览器中与模型交互的交互式小部件。
允许进行推理请求的推理 API。

使用现有模型

Hub 上的预训练模型可以通过一行代码加载：

from sentence_transformers import SentenceTransformer
model = SentenceTransformer('model_name')

这是一个对句子进行编码，然后计算它们之间距离以进行语义搜索的示例。

from sentence_transformers import SentenceTransformer, util
model = SentenceTransformer('multi-qa-MiniLM-L6-cos-v1')

query_embedding = model.encode('How big is London')
passage_embedding = model.encode(['London has 9,787,426 inhabitants at the 2011 census',
                                  'London is known for its finacial district'])

print("Similarity:", util.dot_score(query_embedding, passage_embedding))

如果您想了解如何加载特定模型，可以点击 Use in sentence-transformers，您将获得一个可供加载的工作代码片段！

分享您的模型

您可以使用训练好的模型的 save_to_hub 方法来分享您的 Sentence Transformers 模型。

from sentence_transformers import SentenceTransformer

# Load or train a model
model.save_to_hub("my_new_model")

此命令将创建一个包含自动生成的模型卡片、推理小部件、示例代码片段等功能的仓库！此处为一个示例。

其他资源

Sentence Transformers 库。
Sentence Transformers 文档。
与 Hub 的集成公告。

< > 在 GitHub 上更新