NLP 课程文档
编码器模型
并获得增强文档体验
开始使用
编码器模型仅使用 Transformer 模型的编码器。在每个阶段,注意力层都可以访问初始句子中的所有单词。这些模型通常被描述为具有“双向”注意力,并且通常被称为自动编码模型。
这些模型的预训练通常围绕着以某种方式破坏给定的句子(例如,通过掩盖其中的随机单词)并让模型找到或重建初始句子。
编码器模型最适合需要理解完整句子的任务,例如句子分类、命名实体识别(以及更一般的词语分类)和抽取式问答。
此类模型的代表包括