Transformers.js 文档

处理器

您正在查看的是需要从源码安装。如果您想使用常规的 npm 安装,请查看最新的稳定版本(v3.0.0)。
Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

处理器

处理器用于为模型准备输入(例如文本、图像或音频)。

示例: 使用 WhisperProcessor 为模型准备音频输入。

import { AutoProcessor, read_audio } from '@huggingface/transformers';

const processor = await AutoProcessor.from_pretrained('openai/whisper-tiny.en');
const audio = await read_audio('https://huggingface.co/datasets/Narsil/asr_dummy/resolve/main/mlk.flac', 16000);
const { input_features } = await processor(audio);
// Tensor {
//   data: Float32Array(240000) [0.4752984642982483, 0.5597258806228638, 0.56434166431427, ...],
//   dims: [1, 80, 3000],
//   type: 'float32',
//   size: 240000,
// }

processors.Processor

表示一个从输入中提取特征的处理器。

类型processors 的静态类


new Processor(config, components, chat_template)

使用给定的组件创建一个新的处理器

参数量类型
configObject
componentsRecord.<string, Object>
chat_template字符串

processor.image_processor ⇒ <code> * </code>

类型Processor 的实例属性
返回* - 处理器的图像处理器(如果存在)。


processor.tokenizer ⇒ <code> PreTrainedTokenizer </code> | <code> undefined </code>

类型Processor 的实例属性
返回PreTrainedTokenizer | undefined - 处理器的分词器(如果存在)。


processor.feature_extractor ⇒ <code> * </code>

类型Processor 的实例属性
返回* - 处理器的特征提取器(如果存在)。


processor.apply_chat_template(messages, options) ⇒ <code> * </code>

类型Processor 的实例方法

参数量类型
messages*
选项*

processor.batch_decode(...args) ⇒ <code> * </code>

类型Processor 的实例方法

参数量类型
...args*

processor.decode(...args) ⇒ <code> * </code>

类型Processor 的实例方法

参数量类型
...args*

processor._call(input, ...args) ⇒ <code> Promise. < any > </code>

使用给定的输入调用 feature_extractor 函数。

类型Processor 的实例方法
返回Promise.<any> - 一个解析为提取的特征的 Promise。

参数量类型描述
input任何

要从中提取特征的输入。

...args任何

附加参数。


Processor.from_pretrained(pretrained_model_name_or_path, options) ⇒ <code> Promise. < Processor > </code>

从预训练模型中实例化库中的一个处理器类。

要实例化的处理器类是根据配置对象的 image_processor_type(或旧版的 feature_extractor_type)属性选择的(既可以作为参数传入,也可以在可能的情况下从 pretrained_model_name_or_path 加载)

类型Processor 的静态方法
返回Promise.<Processor> - Processor 类的新实例。

参数量类型描述
pretrained_model_name_or_path字符串

预训练模型的名称或路径。可以是

  • 一个字符串,即托管在 huggingface.co 模型仓库中的预训练处理器的模型 ID。有效的模型 ID 可以位于根级别,如 bert-base-uncased,也可以在用户或组织名称下命名,如 dbmdz/bert-base-german-cased
  • 一个指向包含处理器文件的目录的路径,例如,./my_model_directory/
选项PretrainedProcessorOptions

加载处理器的附加选项。


processors~PreTrainedTokenizer : <code> Object </code>

附加的特定于处理器的属性。

类型processors 的内部类型定义


< > 在 GitHub 上更新