Tokenizers 文档
解码器
并获取增强的文档体验
开始使用
( suffix = '</w>' )
参数
str
</w>
BPEDecoder 解码器
( )
ByteLevel 解码器
此解码器应与 ByteLevel PreTokenizer 预分词器结合使用。
( pad_token = '<pad>' word_delimiter_token = '|' cleanup = True )
<pad>
|
bool
True
CTC 解码器
"always"
Metaspace 解码器
( prefix = '##' cleanup = True )
##
WordPiece 解码器