Transformers.js 文档
处理器
您正在查看的是需要从源码安装。如果您想使用常规的 npm 安装,请查看最新的稳定版本(v3.0.0)。
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
处理器
处理器用于为模型准备输入(例如文本、图像或音频)。
示例: 使用 WhisperProcessor
为模型准备音频输入。
import { AutoProcessor, read_audio } from '@huggingface/transformers';
const processor = await AutoProcessor.from_pretrained('openai/whisper-tiny.en');
const audio = await read_audio('https://huggingface.co/datasets/Narsil/asr_dummy/resolve/main/mlk.flac', 16000);
const { input_features } = await processor(audio);
// Tensor {
// data: Float32Array(240000) [0.4752984642982483, 0.5597258806228638, 0.56434166431427, ...],
// dims: [1, 80, 3000],
// type: 'float32',
// size: 240000,
// }
- 处理器
- 静态
- .Processor
new Processor(config, components, chat_template)
- 实例
.image_processor
⇒*
.tokenizer
⇒PreTrainedTokenizer
|undefined
.feature_extractor
⇒*
.apply_chat_template(messages, options)
⇒*
.batch_decode(...args)
⇒*
.decode(...args)
⇒*
._call(input, ...args)
⇒Promise.<any>
- 静态
.from_pretrained(pretrained_model_name_or_path, options)
⇒Promise.<Processor>
- .Processor
- 内部
~PreTrainedTokenizer
:Object
- 静态
processors.Processor
表示一个从输入中提取特征的处理器。
类型:processors
的静态类
- .Processor
new Processor(config, components, chat_template)
- 实例
.image_processor
⇒*
.tokenizer
⇒PreTrainedTokenizer
|undefined
.feature_extractor
⇒*
.apply_chat_template(messages, options)
⇒*
.batch_decode(...args)
⇒*
.decode(...args)
⇒*
._call(input, ...args)
⇒Promise.<any>
- 静态
.from_pretrained(pretrained_model_name_or_path, options)
⇒Promise.<Processor>
new Processor(config, components, chat_template)
使用给定的组件创建一个新的处理器
参数量 | 类型 |
---|---|
config | Object |
components | Record.<string, Object> |
chat_template | 字符串 |
processor.image_processor ⇒ <code> * </code>
类型:Processor
的实例属性
返回:*
- 处理器的图像处理器(如果存在)。
processor.tokenizer ⇒ <code> PreTrainedTokenizer </code> | <code> undefined </code>
类型:Processor
的实例属性
返回:PreTrainedTokenizer
| undefined
- 处理器的分词器(如果存在)。
processor.feature_extractor ⇒ <code> * </code>
类型:Processor
的实例属性
返回:*
- 处理器的特征提取器(如果存在)。
processor.apply_chat_template(messages, options) ⇒ <code> * </code>
类型:Processor
的实例方法
参数量 | 类型 |
---|---|
messages | * |
选项 | * |
processor.batch_decode(...args) ⇒ <code> * </code>
类型:Processor
的实例方法
参数量 | 类型 |
---|---|
...args | * |
processor.decode(...args) ⇒ <code> * </code>
类型:Processor
的实例方法
参数量 | 类型 |
---|---|
...args | * |
processor._call(input, ...args) ⇒ <code> Promise. < any > </code>
使用给定的输入调用 feature_extractor 函数。
类型:Processor
的实例方法
返回:Promise.<any>
- 一个解析为提取的特征的 Promise。
参数量 | 类型 | 描述 |
---|---|---|
input | 任何 | 要从中提取特征的输入。 |
...args | 任何 | 附加参数。 |
Processor.from_pretrained(pretrained_model_name_or_path, options) ⇒ <code> Promise. < Processor > </code>
从预训练模型中实例化库中的一个处理器类。
要实例化的处理器类是根据配置对象的 image_processor_type
(或旧版的 feature_extractor_type
)属性选择的(既可以作为参数传入,也可以在可能的情况下从 pretrained_model_name_or_path
加载)
类型:Processor
的静态方法
返回:Promise.<Processor>
- Processor 类的新实例。
参数量 | 类型 | 描述 |
---|---|---|
pretrained_model_name_or_path | 字符串 | 预训练模型的名称或路径。可以是
|
选项 | PretrainedProcessorOptions | 加载处理器的附加选项。 |
processors~PreTrainedTokenizer : <code> Object </code>
附加的特定于处理器的属性。
类型:processors
的内部类型定义
< > 在 GitHub 上更新