Transformers 文档

RAG

Transformers

加入 Hugging Face 社区

并获得增强的文档体验

协作处理模型、数据集和 Spaces

通过加速推理获得更快的示例

切换文档主题

开始使用

RAG

概述

检索增强生成（“RAG”）模型结合了预训练密集检索（DPR）和序列到序列模型的强大功能。RAG 模型检索文档，将它们传递给 seq2seq 模型，然后进行边缘化以生成输出。检索器和 seq2seq 模块从预训练模型初始化，并联合微调，允许检索和生成都适应下游任务。

它基于 Patrick Lewis、Ethan Perez、Aleksandara Piktus、Fabio Petroni、Vladimir Karpukhin、Naman Goyal、Heinrich Küttler、Mike Lewis、Wen-tau Yih、Tim Rocktäschel、Sebastian Riedel、Douwe Kiela 的论文 Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks。

该论文的摘要如下：

大型预训练语言模型已被证明可以将事实知识存储在其参数中，并在下游 NLP 任务上进行微调时取得最先进的结果。然而，它们访问和精确操纵知识的能力仍然有限，因此在知识密集型任务中，它们的性能落后于特定于任务的架构。此外，为其决策提供出处并更新其世界知识仍然是开放的研究问题。具有可微分访问显式非参数记忆机制的预训练模型可以克服这个问题，但到目前为止，仅针对抽取式下游任务进行了研究。我们探索了一种用于检索增强生成（RAG）的通用微调方法 - 该模型结合了用于语言生成的预训练参数记忆和非参数记忆。我们介绍了 RAG 模型，其中参数记忆是预训练的 seq2seq 模型，非参数记忆是维基百科的密集向量索引，通过预训练的神经检索器访问。我们比较了两种 RAG 公式，一种在整个生成的序列中以相同的检索段落为条件，另一种可以使用每个 token 的不同段落。我们在广泛的知识密集型 NLP 任务上微调和评估了我们的模型，并在三个开放域 QA 任务上设置了最先进的水平，优于参数 seq2seq 模型和特定于任务的检索和抽取架构。对于语言生成任务，我们发现 RAG 模型比最先进的纯参数 seq2seq 基线生成更具体、多样化和基于事实的语言。

此模型由 ola13 贡献。

使用技巧

检索增强生成（“RAG”）模型结合了预训练密集检索（DPR）和 Seq2Seq 模型的强大功能。RAG 模型检索文档 (docs)，将它们传递给 seq2seq 模型，然后进行边缘化以生成输出。检索器和 seq2seq 模块从预训练模型初始化，并联合微调，允许检索和生成都适应下游任务。

Transformers

RAG

概述

使用技巧

RagConfig

class transformers.RagConfig

from_question_encoder_generator_configs

RagTokenizer

class transformers.RagTokenizer

Rag 特定输出

类 transformers.models.rag.modeling_rag.RetrievAugLMMarginOutput

类 transformers.models.rag.modeling_rag.RetrievAugLMOutput

RagRetriever

class transformers.RagRetriever

init_retrieval

postprocess_docs

retrieve

RagModel

class transformers.RagModel

forward

RagSequenceForGeneration

class transformers.RagSequenceForGeneration

forward

generate

RagTokenForGeneration

类 transformers.RagTokenForGeneration

forward

generate

TFRagModel

class transformers.TFRagModel

call

TFRagSequenceForGeneration

class transformers.TFRagSequenceForGeneration

call

generate

TFRagTokenForGeneration

class transformers.TFRagTokenForGeneration

call

generate