分词器文档
可视化工具
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
可视化工具
Python
Rust
Node
Annotation
EncodingVisualizer
class tokenizers.tools.EncodingVisualizer
< source >( tokenizer: Tokenizer default_to_notebook: bool = True annotation_converter: Optional = None )
参数
- tokenizer (Tokenizer) — 一个分词器实例
- default_to_notebook (
bool
) — 是否默认在 notebook 中渲染 HTML 输出 - annotation_converter (
Callable
, optional) — 一个可选的(lambda)函数,它接受任何格式的标注并返回一个 Annotation 对象
构建一个 EncodingVisualizer
__call__
< source >( text: str annotations: List = [] default_to_notebook: Optional = None )
构建给定文本的可视化