Transformers 文档

Blenderbot

Transformers

加入 Hugging Face 社区

并获得增强的文档体验

协作处理模型、数据集和 Spaces

通过加速推理获得更快的示例

切换文档主题

开始使用

Blenderbot

概述

Blender 聊天机器人模型在 Recipes for building an open-domain chatbot Stephen Roller, Emily Dinan, Naman Goyal, Da Ju, Mary Williamson, Yinhan Liu, Jing Xu, Myle Ott, Kurt Shuster, Eric M. Smith, Y-Lan Boureau, Jason Weston 于 2020 年 4 月 30 日提出。

该论文的摘要如下

构建开放域聊天机器人是机器学习研究中一个具有挑战性的领域。虽然先前的工作表明，在参数数量和训练数据规模上扩展神经模型可以改进结果，但我们表明，其他要素对于高性能聊天机器人也很重要。良好的对话需要专家级对话者以无缝方式融合多种技能：提供引人入胜的谈话要点并倾听伙伴的意见，并适当地展示知识、同理心和个性，同时保持一致的形象。我们表明，当给予适当的训练数据和生成策略选择时，大规模模型可以学习这些技能。我们构建了参数模型分别为 90M、2.7B 和 9.4B 的这些配方的变体，并公开了我们的模型和代码。人类评估表明，就吸引力和人性化指标而言，我们最好的模型优于现有的多轮对话方法。然后，我们通过分析模型的失败案例来讨论这项工作的局限性。

此模型由 sshleifer 贡献。作者的代码可以在这里找到。

使用技巧和示例

Blenderbot 是一个具有绝对位置嵌入的模型，因此通常建议在右侧而不是左侧填充输入。

一个例子

>>> from transformers import BlenderbotTokenizer, BlenderbotForConditionalGeneration

>>> mname = "facebook/blenderbot-400M-distill"
>>> model = BlenderbotForConditionalGeneration.from_pretrained(mname)
>>> tokenizer = BlenderbotTokenizer.from_pretrained(mname)
>>> UTTERANCE = "My friends are cool but they eat too many carbs."
>>> inputs = tokenizer([UTTERANCE], return_tensors="pt")
>>> reply_ids = model.generate(**inputs)
>>> print(tokenizer.batch_decode(reply_ids))
["<s> That's unfortunate. Are they trying to lose weight or are they just trying to be healthier?</s>"]

实现说明

Blenderbot 使用标准的基于 seq2seq 模型 transformer 的架构。
可在模型中心找到可用的检查点。
这是默认的 Blenderbot 模型类。但是，一些较小的检查点，例如 facebook/blenderbot_small_90M，具有不同的架构，因此应与BlenderbotSmall 一起使用。

Transformers

Blenderbot

概述

使用技巧和示例

实现说明

资源

BlenderbotConfig

class transformers.BlenderbotConfig

BlenderbotTokenizer

class transformers.BlenderbotTokenizer

build_inputs_with_special_tokens

BlenderbotTokenizerFast

class transformers.BlenderbotTokenizerFast

build_inputs_with_special_tokens

BlenderbotModel

class transformers.BlenderbotModel

forward

BlenderbotForConditionalGeneration

class transformers.BlenderbotForConditionalGeneration

forward

BlenderbotForCausalLM

class transformers.BlenderbotForCausalLM

forward

TFBlenderbotModel

class transformers.TFBlenderbotModel

call

TFBlenderbotForConditionalGeneration

class transformers.TFBlenderbotForConditionalGeneration

call

FlaxBlenderbotModel

class transformers.FlaxBlenderbotModel

__call__

encode

decode

FlaxBlenderbotForConditionalGeneration

class transformers.FlaxBlenderbotForConditionalGeneration

__call__

encode

decode

call

call