Transformers 文档

CamemBERT

Transformers

加入 Hugging Face 社区

并获得增强的文档体验

在模型、数据集和 Spaces 上进行协作

通过加速推理获得更快的示例

切换文档主题

开始使用

CamemBERT

概述

CamemBERT 模型由 Louis Martin、Benjamin Muller、Pedro Javier Ortiz Suárez、Yoann Dupont、Laurent Romary、Éric Villemonte de la Clergerie、Djamé Seddah 和 Benoît Sagot 在论文 CamemBERT: a Tasty French Language Model 中提出。它基于 Facebook 于 2019 年发布的 RoBERTa 模型。这是一个在 138GB 法语文本上训练的模型。

论文摘要如下：

预训练语言模型目前在自然语言处理中无处不在。尽管它们取得了成功，但大多数可用模型要么是在英语数据上训练的，要么是在多种语言数据的拼接上训练的。这使得这些模型在除英语之外的所有语言中的实际应用非常有限。为了解决法语的这个问题，我们发布了 CamemBERT，这是一个法语版本的双向 Transformer 编码器（BERT）。我们在多个下游任务中衡量了 CamemBERT 相对于多语言模型的性能，这些任务包括词性标注、依存句法分析、命名实体识别和自然语言推理。CamemBERT 在大多数考虑的任务中都提升了现有技术水平。我们发布 CamemBERT 的预训练模型，希望能够促进法语自然语言处理的研究和下游应用。

此模型由 ALMAnaCH 团队 (Inria) 贡献。原始代码可以在这里找到。

此实现与 RoBERTa 相同。有关用法示例以及输入和输出的相关信息，请参阅 RoBERTa 文档。

资源

CamembertConfig

class transformers.CamembertConfig

< 源 >

( vocab_size = 30522 hidden_size = 768 num_hidden_layers = 12 num_attention_heads = 12 intermediate_size = 3072 hidden_act = 'gelu' hidden_dropout_prob = 0.1 attention_probs_dropout_prob = 0.1 max_position_embeddings = 512 type_vocab_size = 2 initializer_range = 0.02 layer_norm_eps = 1e-12 pad_token_id = 1 bos_token_id = 0 eos_token_id = 2 position_embedding_type = 'absolute' use_cache = True classifier_dropout = None **kwargs )

参数

vocab_size (int, 可选, 默认为 30522) — BERT 模型的词汇表大小。定义了在调用 CamembertModel 或 TFCamembertModel 时，可以通过 inputs_ids 表示的不同词元（token）的数量。
hidden_size (int, 可选, 默认为 768) — 编码器层和池化层的维度。
num_hidden_layers (int, 可选, 默认为 12) — Transformer 编码器中的隐藏层数量。
num_attention_heads (int, 可选, 默认为 12) — Transformer 编码器中每个注意力层的注意力头数量。
intermediate_size (int, 可选, 默认为 3072) — Transformer 编码器中“中间层”（通常称为前馈层）的维度。
hidden_act (str 或 Callable, 可选, 默认为 "gelu") — 编码器和池化层中的非线性激活函数（函数或字符串）。如果是字符串，支持 "gelu"、"relu"、"silu" 和 "gelu_new"。
hidden_dropout_prob (float, 可选, 默认为 0.1) — 嵌入层、编码器和池化层中所有全连接层的丢弃概率。
attention_probs_dropout_prob (float, 可选, 默认为 0.1) — 注意力概率的丢弃率。
max_position_embeddings (int, 可选, 默认为 512) — 此模型可能使用的最大序列长度。通常将其设置为一个较大的值以备不时之需（例如，512、1024 或 2048）。
type_vocab_size (int, 可选, 默认为 2) — token_type_ids 的词汇表大小，在调用 CamembertModel 或 TFCamembertModel 时传入。
initializer_range (float, 可选, 默认为 0.02) — 用于初始化所有权重矩阵的截断正态分布初始化器的标准差。
layer_norm_eps (float, 可选, 默认为 1e-12) — 层归一化层使用的 epsilon 值。
position_embedding_type (str, 可选, 默认为 "absolute") — 位置嵌入的类型。从 "absolute"、"relative_key"、"relative_key_query" 中选择一个。对于位置嵌入，请使用 "absolute"。有关 "relative_key" 的更多信息，请参阅 Self-Attention with Relative Position Representations (Shaw et al.)。有关 "relative_key_query" 的更多信息，请参阅 Improve Transformer Models with Better Relative Position Embeddings (Huang et al.) 中的 Method 4。
is_decoder (bool, 可选, 默认为 False) — 模型是否用作解码器。如果为 False，则模型用作编码器。
use_cache (bool, 可选, 默认为 True) — 模型是否应返回最后的键/值注意力（并非所有模型都使用）。仅在 config.is_decoder=True 时相关。
classifier_dropout (float, 可选) — 分类头的丢弃率。

这是一个配置类，用于存储 CamembertModel 或 TFCamembertModel 的配置。它用于根据指定的参数实例化 Camembert 模型，定义模型架构。使用默认值实例化配置将产生与 Camembert almanach/camembert-base 架构类似的配置。

配置对象继承自 PretrainedConfig，可用于控制模型输出。有关更多信息，请阅读 PretrainedConfig 的文档。

示例

>>> from transformers import CamembertConfig, CamembertModel

>>> # Initializing a Camembert almanach/camembert-base style configuration
>>> configuration = CamembertConfig()

>>> # Initializing a model (with random weights) from the almanach/camembert-base style configuration
>>> model = CamembertModel(configuration)

>>> # Accessing the model configuration
>>> configuration = model.config

Transformers

CamemBERT

概述

资源

CamembertConfig

class transformers.CamembertConfig

CamembertTokenizer

class transformers.CamembertTokenizer

build_inputs_with_special_tokens

get_special_tokens_mask

create_token_type_ids_from_sequences

save_vocabulary

CamembertTokenizerFast

class transformers.CamembertTokenizerFast

build_inputs_with_special_tokens

create_token_type_ids_from_sequences

CamembertModel

class transformers.CamembertModel

forward

CamembertForCausalLM

class transformers.CamembertForCausalLM

forward

CamembertForMaskedLM

class transformers.CamembertForMaskedLM

forward

CamembertForSequenceClassification

class transformers.CamembertForSequenceClassification

forward

CamembertForMultipleChoice

class transformers.CamembertForMultipleChoice

forward

CamembertForTokenClassification

class transformers.CamembertForTokenClassification

forward

CamembertForQuestionAnswering

class transformers.CamembertForQuestionAnswering

forward

TFCamembertModel

class transformers.TFCamembertModel

调用

TFCamembertForCausalLM

class transformers.TFCamembertForCausalLM

调用

TFCamembertForMaskedLM

class transformers.TFCamembertForMaskedLM

调用

TFCamembertForSequenceClassification

class transformers.TFCamembertForSequenceClassification

调用

TFCamembertForMultipleChoice

class transformers.TFCamembertForMultipleChoice

调用

TFCamembertForTokenClassification

class transformers.TFCamembertForTokenClassification

调用

TFCamembertForQuestionAnswering

class transformers.TFCamembertForQuestionAnswering

调用