Transformers.js 文档
utils/generation
并获得增强的文档体验
开始使用
utils/generation
用于生成任务的类、函数和实用工具。
待办
- 描述如何创建自定义
GenerationConfig
。
- utils/generation
- 静态
- .LogitsProcessorList ⇐
Callable
- .LogitsProcessor ⇐
Callable
- .ForceTokensLogitsProcessor ⇐
LogitsProcessor
- .ForcedBOSTokenLogitsProcessor ⇐
LogitsProcessor
- .ForcedEOSTokenLogitsProcessor ⇐
LogitsProcessor
- .SuppressTokensAtBeginLogitsProcessor ⇐
LogitsProcessor
- .WhisperTimeStampLogitsProcessor ⇐
LogitsProcessor
- .NoRepeatNGramLogitsProcessor ⇐
LogitsProcessor
new NoRepeatNGramLogitsProcessor(no_repeat_ngram_size)
.getNgrams(prevInputIds)
⇒Map.<string, Array<number>>
.getGeneratedNgrams(bannedNgrams, prevInputIds)
⇒Array.<number>
.calcBannedNgramTokens(prevInputIds)
⇒Array.<number>
._call(input_ids, logits)
⇒Object
- .RepetitionPenaltyLogitsProcessor ⇐
LogitsProcessor
- .MinLengthLogitsProcessor ⇐
LogitsProcessor
- .MinNewTokensLengthLogitsProcessor ⇐
LogitsProcessor
- .NoBadWordsLogitsProcessor
- .Sampler
new Sampler(generation_config)
- 实例
._call(logits, index)
⇒void
.sample(logits, index)
.getLogits(logits, index)
⇒Float32Array
.randomSelect(probabilities)
⇒number
- 静态
.getSampler(generation_config)
⇒Sampler
.GenerationConfig
:*
- .LogitsProcessorList ⇐
- 内部
- ~GenerationConfig
- ~GreedySampler ⇐
Sampler
.sample(logits, [index])
⇒Array
- ~MultinomialSampler ⇐
Sampler
.sample(logits, index)
⇒Array
- ~BeamSearchSampler ⇐
Sampler
.sample(logits, index)
⇒Array
~GenerationConfigType
:Object
- 静态
utils/generation.LogitsProcessorList ⇐ <code> Callable </code>
一个表示 logits 处理器列表的类。logits 处理器是修改语言模型输出 logits 的函数。该类提供了添加新处理器并将所有处理器应用于一批 logits 的方法。
类型:utils/generation
的静态类
继承:Callable
- .LogitsProcessorList ⇐
Callable
new LogitsProcessorList()
构造 LogitsProcessorList
的新实例。
logitsProcessorList.push(item)
向列表添加新的 logits 处理器。
类型:LogitsProcessorList
的实例方法
参数量 | 类型 | 描述 |
---|---|---|
item | LogitsProcessor | 要添加的 logits 处理器函数。 |
logitsProcessorList.extend(items)
向列表添加多个 logits 处理器。
类型:LogitsProcessorList
的实例方法
参数量 | 类型 | 描述 |
---|---|---|
items | Array.<LogitsProcessor> | 要添加的 logits 处理器函数。 |
logitsProcessorList._call(input_ids, batchedLogits)
将列表中所有的 logits 处理器应用于一批 logits,并就地修改它们。
类型:LogitsProcessorList
的实例方法
参数量 | 类型 | 描述 |
---|---|---|
input_ids | Array.<number> | 语言模型的输入 ID。 |
batchedLogits | Array.<Array<number>> | 一个二维 logits 数组,其中每行对应于批处理中的单个输入序列。 |
utils/generation.LogitsProcessor ⇐ <code> Callable </code>
logits 处理器的基类。
类型:utils/generation
的静态类
继承:Callable
logitsProcessor._call(input_ids, logits)
将处理器应用于输入 logits。
类型:LogitsProcessor
的实例抽象方法
抛出:
Error
如果子类未实现 `_call`,则抛出错误。
参数量 | 类型 | 描述 |
---|---|---|
input_ids | 数组 | 输入 ID。 |
logits | 张量 | 要处理的 logits。 |
utils/generation.ForceTokensLogitsProcessor ⇐ <code> LogitsProcessor </code>
一个强制解码器生成特定 token 的 logits 处理器。
类型:utils/generation
的静态类
继承:LogitsProcessor
- .ForceTokensLogitsProcessor ⇐
LogitsProcessor
new ForceTokensLogitsProcessor(forced_decoder_ids)
构造 ForceTokensLogitsProcessor
的新实例。
参数量 | 类型 | 描述 |
---|---|---|
forced_decoder_ids | 数组 | 要强制生成的 token ID。 |
forceTokensLogitsProcessor._call(input_ids, logits) ⇒ <code> Tensor </code>
将处理器应用于输入 logits。
类型:ForceTokensLogitsProcessor
的实例方法
返回:Tensor
- 处理后的 logits。
参数量 | 类型 | 描述 |
---|---|---|
input_ids | 数组 | 输入 ID。 |
logits | 张量 | 要处理的 logits。 |
utils/generation.ForcedBOSTokenLogitsProcessor ⇐ <code> LogitsProcessor </code>
一个 LogitsProcessor,它强制在生成的序列开头添加 BOS token。
类型:utils/generation
的静态类
继承:LogitsProcessor
- .ForcedBOSTokenLogitsProcessor ⇐
LogitsProcessor
new ForcedBOSTokenLogitsProcessor(bos_token_id)
创建一个 ForcedBOSTokenLogitsProcessor。
参数量 | 类型 | 描述 |
---|---|---|
bos_token_id | 数字 | 要强制使用的序列开始 token 的 ID。 |
forcedBOSTokenLogitsProcessor._call(input_ids, logits) ⇒ <code> Object </code>
将 BOS token 强制应用于 logits。
类型:ForcedBOSTokenLogitsProcessor
的实例方法
返回:Object
- 强制使用 BOS token 的 logits。
参数量 | 类型 | 描述 |
---|---|---|
input_ids | 数组 | 输入 ID。 |
logits | Object | logits。 |
utils/generation.ForcedEOSTokenLogitsProcessor ⇐ <code> LogitsProcessor </code>
一个 logits 处理器,它将序列结束 token 的概率强制设置为 1。
类型:utils/generation
的静态类
继承:LogitsProcessor
- .ForcedEOSTokenLogitsProcessor ⇐
LogitsProcessor
new ForcedEOSTokenLogitsProcessor(max_length, forced_eos_token_id)
创建一个 ForcedEOSTokenLogitsProcessor。
参数量 | 类型 | 描述 |
---|---|---|
max_length | 数字 | 序列的最大长度。 |
forced_eos_token_id | number | Array<number> | 要强制使用的序列结束 token 的 ID。 |
forcedEOSTokenLogitsProcessor._call(input_ids, logits)
将处理器应用于 input_ids 和 logits。
类型:ForcedEOSTokenLogitsProcessor
的实例方法
参数量 | 类型 | 描述 |
---|---|---|
input_ids | Array.<number> | 输入 ID。 |
logits | 张量 | logits 张量。 |
utils/generation.SuppressTokensAtBeginLogitsProcessor ⇐ <code> LogitsProcessor </code>
一个 LogitsProcessor,它在 generate
函数开始使用 begin_index
个 token 生成时立即抑制 token 列表。这应确保在生成开始时不会采样由 begin_suppress_tokens
定义的 token。
类型:utils/generation
的静态类
继承:LogitsProcessor
- .SuppressTokensAtBeginLogitsProcessor ⇐
LogitsProcessor
new SuppressTokensAtBeginLogitsProcessor(begin_suppress_tokens, begin_index)
创建一个 SuppressTokensAtBeginLogitsProcessor。
参数量 | 类型 | 描述 |
---|---|---|
begin_suppress_tokens | Array.<number> | 要抑制的 token ID。 |
begin_index | 数字 | 在抑制 token 之前要生成的 token 数量。 |
suppressTokensAtBeginLogitsProcessor._call(input_ids, logits) ⇒ <code> Object </code>
将 BOS token 强制应用于 logits。
类型:SuppressTokensAtBeginLogitsProcessor
的实例方法
返回:Object
- 强制使用 BOS token 的 logits。
参数量 | 类型 | 描述 |
---|---|---|
input_ids | 数组 | 输入 ID。 |
logits | Object | logits。 |
utils/generation.WhisperTimeStampLogitsProcessor ⇐ <code> LogitsProcessor </code>
一个 LogitsProcessor,用于处理向生成的文本添加时间戳。
类型:utils/generation
的静态类
继承:LogitsProcessor
- .WhisperTimeStampLogitsProcessor ⇐
LogitsProcessor
new WhisperTimeStampLogitsProcessor(generate_config)
构造一个新的 WhisperTimeStampLogitsProcessor。
参数量 | 类型 | 描述 |
---|---|---|
generate_config | Object | 传递给 transformer 模型 |
generate_config.eos_token_id | 数字 | 序列结束 token 的 ID。 |
generate_config.no_timestamps_token_id | 数字 | 用于指示 token 不应包含时间戳的 token ID。 |
[generate_config.forced_decoder_ids] | Array.<Array<number>> | 一个由两个元素组成的数组,表示强制出现在输出中的解码器 ID。每个数组的第二个元素指示该 token 是否为时间戳。 |
[generate_config.max_initial_timestamp_index] | 数字 | 初始时间戳可以出现的最大索引。 |
whisperTimeStampLogitsProcessor._call(input_ids, logits) ⇒ <code> Tensor </code>
修改 logits 以处理时间戳 token。
类型:WhisperTimeStampLogitsProcessor
的实例方法
返回:Tensor
- 修改后的 logits。
参数量 | 类型 | 描述 |
---|---|---|
input_ids | 数组 | 输入 token 序列。 |
logits | 张量 | 模型输出的 logits。 |
utils/generation.NoRepeatNGramLogitsProcessor ⇐ <code> LogitsProcessor </code>
一个 logits 处理器,它不允许重复一定大小的 n-gram。
类型:utils/generation
的静态类
继承:LogitsProcessor
- .NoRepeatNGramLogitsProcessor ⇐
LogitsProcessor
new NoRepeatNGramLogitsProcessor(no_repeat_ngram_size)
.getNgrams(prevInputIds)
⇒Map.<string, Array<number>>
.getGeneratedNgrams(bannedNgrams, prevInputIds)
⇒Array.<number>
.calcBannedNgramTokens(prevInputIds)
⇒Array.<number>
._call(input_ids, logits)
⇒Object
new NoRepeatNGramLogitsProcessor(no_repeat_ngram_size)
创建一个 NoRepeatNGramLogitsProcessor。
参数量 | 类型 | 描述 |
---|---|---|
no_repeat_ngram_size | 数字 | 不重复 n-gram 的大小。所有此大小的 n-gram 只能出现一次。 |
noRepeatNGramLogitsProcessor.getNgrams(prevInputIds) ⇒ <code> Map. < string, Array < number > > </code>
从 token ID 序列生成 n-gram。
类型:NoRepeatNGramLogitsProcessor
的实例方法
返回:Map.<string, Array<number>>
- 生成的 n-gram 的映射
参数量 | 类型 | 描述 |
---|---|---|
prevInputIds | Array.<number> | 上一个输入 ID 列表 |
noRepeatNGramLogitsProcessor.getGeneratedNgrams(bannedNgrams, prevInputIds) ⇒ <code> Array. < number > </code>
从 token ID 序列生成 n-gram。
类型:NoRepeatNGramLogitsProcessor
的实例方法
返回:Array.<number>
- 生成的 n-gram 的映射
参数量 | 类型 | 描述 |
---|---|---|
bannedNgrams | Map.<string, Array<number>> | 禁用 n-gram 的映射 |
prevInputIds | Array.<number> | 上一个输入 ID 列表 |
noRepeatNGramLogitsProcessor.calcBannedNgramTokens(prevInputIds) ⇒ <code> Array. < number > </code>
计算禁止的 n-gram token
类型:NoRepeatNGramLogitsProcessor
的实例方法
返回:Array.<number>
- 生成的 n-gram 的映射
参数量 | 类型 | 描述 |
---|---|---|
prevInputIds | Array.<number> | 上一个输入 ID 列表 |
noRepeatNGramLogitsProcessor._call(input_ids, logits) ⇒ <code> Object </code>
将不重复 n-gram 处理器应用于 logits。
类型:NoRepeatNGramLogitsProcessor
的实例方法
返回:Object
- 经过不重复 n-gram 处理的 logits。
参数量 | 类型 | 描述 |
---|---|---|
input_ids | 数组 | 输入 ID。 |
logits | Object | logits。 |
utils/generation.RepetitionPenaltyLogitsProcessor ⇐ <code> LogitsProcessor </code>
一个对重复输出 token 进行惩罚的 logits 处理器。
类型:utils/generation
的静态类
继承:LogitsProcessor
- .RepetitionPenaltyLogitsProcessor ⇐
LogitsProcessor
new RepetitionPenaltyLogitsProcessor(penalty)
创建一个 RepetitionPenaltyLogitsProcessor。
参数量 | 类型 | 描述 |
---|---|---|
penalty | 数字 | 对重复 token 应用的惩罚。 |
repetitionPenaltyLogitsProcessor._call(input_ids, logits) ⇒ <code> Object </code>
将重复惩罚应用于 logits。
类型:RepetitionPenaltyLogitsProcessor
的实例方法
返回:Object
- 经过重复惩罚处理的 logits。
参数量 | 类型 | 描述 |
---|---|---|
input_ids | 数组 | 输入 ID。 |
logits | Object | logits。 |
utils/generation.MinLengthLogitsProcessor ⇐ <code> LogitsProcessor </code>
一个强制最小 token 数量的 logits 处理器。
类型:utils/generation
的静态类
继承:LogitsProcessor
- .MinLengthLogitsProcessor ⇐
LogitsProcessor
new MinLengthLogitsProcessor(min_length, eos_token_id)
创建一个 MinLengthLogitsProcessor。
参数量 | 类型 | 描述 |
---|---|---|
min_length | 数字 | 当长度低于此值时, |
eos_token_id | number | Array<number> | 序列结束 token 的 ID。 |
minLengthLogitsProcessor._call(input_ids, logits) ⇒ <code> Object </code>
应用 logits 处理器。
类型:MinLengthLogitsProcessor
的实例方法
返回:Object
- 处理后的 logits。
参数量 | 类型 | 描述 |
---|---|---|
input_ids | 数组 | 输入 ID。 |
logits | Object | logits。 |
utils/generation.MinNewTokensLengthLogitsProcessor ⇐ <code> LogitsProcessor </code>
一个强制最小新 token 数量的 logits 处理器。
类型:utils/generation
的静态类
继承:LogitsProcessor
- .MinNewTokensLengthLogitsProcessor ⇐
LogitsProcessor
new MinNewTokensLengthLogitsProcessor(prompt_length_to_skip, min_new_tokens, eos_token_id)
创建一个 MinNewTokensLengthLogitsProcessor。
参数量 | 类型 | 描述 |
---|---|---|
prompt_length_to_skip | 数字 | 输入 token 长度。 |
min_new_tokens | 数字 | 当新 token 长度低于此值时, |
eos_token_id | number | Array<number> | 序列结束 token 的 ID。 |
minNewTokensLengthLogitsProcessor._call(input_ids, logits) ⇒ <code> Object </code>
应用 logits 处理器。
类型:MinNewTokensLengthLogitsProcessor
的实例方法
返回:Object
- 处理后的 logits。
参数量 | 类型 | 描述 |
---|---|---|
input_ids | 数组 | 输入 ID。 |
logits | Object | logits。 |
utils/generation.NoBadWordsLogitsProcessor
类型:utils/generation
的静态类
new NoBadWordsLogitsProcessor(bad_words_ids, eos_token_id)
创建一个 NoBadWordsLogitsProcessor
。
参数量 | 类型 | 描述 |
---|---|---|
bad_words_ids | Array.<Array<number>> | 不允许生成的 token ID 列表的列表。 |
eos_token_id | number | Array<number> | “序列结束”标记的 ID。可选地,使用列表来设置多个“序列结束”标记。 |
noBadWordsLogitsProcessor._call(input_ids, logits) ⇒ <code> Object </code>
应用 logits 处理器。
类型:NoBadWordsLogitsProcessor
的实例方法
返回:Object
- 处理后的 logits。
参数量 | 类型 | 描述 |
---|---|---|
input_ids | 数组 | 输入 ID。 |
logits | Object | logits。 |
utils/generation.Sampler
Sampler 是所有用于文本生成的采样方法的基类。
类型:utils/generation
的静态类
- .Sampler
new Sampler(generation_config)
- 实例
._call(logits, index)
⇒void
.sample(logits, index)
.getLogits(logits, index)
⇒Float32Array
.randomSelect(probabilities)
⇒number
- 静态
.getSampler(generation_config)
⇒Sampler
new Sampler(generation_config)
创建具有指定生成配置的新 Sampler 对象。
参数量 | 类型 | 描述 |
---|---|---|
generation_config | GenerationConfigType | 生成配置。 |
sampler._call(logits, index) ⇒ <code> void </code>
执行采样器,使用指定的 logits。
类型:Sampler
的实例方法
参数量 | 类型 |
---|---|
logits | 张量 |
索引 | 数字 |
sampler.sample(logits, index)
用于采样 logits 的抽象方法。
类型:Sampler
的实例方法
抛出:
错误
参数量 | 类型 |
---|---|
logits | 张量 |
索引 | 数字 |
sampler.getLogits(logits, index) ⇒ <code> Float32Array </code>
将指定的 logits 作为数组返回,并应用了温度。
类型:Sampler
的实例方法
参数量 | 类型 |
---|---|
logits | 张量 |
索引 | 数字 |
sampler.randomSelect(probabilities) ⇒ <code> number </code>
根据指定的概率随机选择一个项目。
类型:Sampler
的实例方法
返回:number
- 所选项目的索引。
参数量 | 类型 | 描述 |
---|---|---|
probabilities | 数组 | 用于选择的概率数组。 |
Sampler.getSampler(generation_config) ⇒ <code> Sampler </code>
根据指定选项返回一个 Sampler 对象。
类型:Sampler
的静态方法Sampler
返回:Sampler
- 一个 Sampler 对象。
参数量 | 类型 | 描述 |
---|---|---|
generation_config | GenerationConfigType | 包含采样器选项的对象。 |
utils/generation.GenerationConfig : <code> * </code>
保存生成任务配置的类。
类型:utils/generation
的静态常量utils/generation
utils/generation~GenerationConfig
类型:utils/generation
的内部类utils/generation
new GenerationConfig(kwargs)
创建一个新的 GenerationConfig 对象。
参数量 | 类型 |
---|---|
kwargs | GenerationConfigType |
utils/generation~GreedySampler ⇐ <code> Sampler </code>
表示贪婪采样器的类。
类型:utils/generation
的内部类utils/generation
继承:Sampler
greedySampler.sample(logits, [index]) ⇒ <code> Array </code>
对给定 logits 张量的最大概率进行采样。
类型:GreedySampler
的实例方法GreedySampler
返回:Array
- 包含一个元组的数组,该元组包含最大值的索引和无意义的分数(因为这是贪婪搜索)。
参数量 | 类型 | 默认 |
---|---|---|
logits | 张量 | |
[index] | 数字 | -1 |
utils/generation~MultinomialSampler ⇐ <code> Sampler </code>
表示多项式采样器的类。
类型:utils/generation
的内部类utils/generation
继承:Sampler
multinomialSampler.sample(logits, index) ⇒ <code> Array </code>
从 logits 中采样。
类型:MultinomialSampler
的实例方法MultinomialSampler
参数量 | 类型 |
---|---|
logits | 张量 |
索引 | 数字 |
utils/generation~BeamSearchSampler ⇐ <code> Sampler </code>
表示 BeamSearchSampler 的类。
类型:utils/generation
的内部类utils/generation
继承:Sampler
beamSearchSampler.sample(logits, index) ⇒ <code> Array </code>
从 logits 中采样。
类型:BeamSearchSampler
的实例方法BeamSearchSampler
参数量 | 类型 |
---|---|
logits | 张量 |
索引 | 数字 |
utils/generation~GenerationConfigType : <code> Object </code>
默认配置参数。
类型:utils/generation
的内部类型定义utils/generation
属性
名称 | 类型 | 默认 | 描述 |
---|---|---|---|
[max_length] | 数字 | 20 | 生成的令牌可以具有的最大长度。对应于输入提示的长度 + |
[max_new_tokens] | 数字 |
| 要生成的最大令牌数,忽略提示中的令牌数。 |
[min_length] | 数字 | 0 | 要生成的序列的最小长度。对应于输入提示的长度 + |
[min_new_tokens] | 数字 |
| 要生成的最小令牌数,忽略提示中的令牌数。 |
[early_stopping] | boolean | "never" | false | 控制基于束的方法(如束搜索)的停止条件。它接受以下值
|
[max_time] | 数字 |
| 允许计算运行的最大时间(秒)。生成将在分配时间过后完成当前轮次。 |
[do_sample] | boolean | false | 是否使用采样;否则使用贪婪解码。 |
[num_beams] | 数字 | 1 | 束搜索的束数。1 表示没有束搜索。 |
[num_beam_groups] | 数字 | 1 | 将 |
[penalty_alpha] | 数字 |
| 这些值平衡了模型置信度和对比搜索解码中的退化惩罚。 |
[use_cache] | boolean | true | 模型是否应使用过去的最后键/值注意力(如果适用于模型)以加快解码速度。 |
[temperature] | 数字 | 1.0 | 用于调节下一个 token 概率的值。 |
[top_k] | 数字 | 50 | 保留用于 top-k 过滤的最高概率词汇 token 数量。 |
[top_p] | 数字 | 1.0 | 如果设置为小于 1 的浮点数,则仅保留概率总和达到 |
[typical_p] | 数字 | 1.0 | 局部典型性衡量预测下一个目标令牌的条件概率与预测下一个随机令牌的预期条件概率的相似程度,给定已生成的文本片段。如果设置为小于 1 的浮点数,则保留局部典型性最高且概率总和达到 |
[epsilon_cutoff] | 数字 | 0.0 | 如果设置为严格介于 0 和 1 之间的浮点数,则只采样条件概率大于 |
[eta_cutoff] | 数字 | 0.0 | Eta 采样是局部典型性采样和 epsilon 采样的混合。如果设置为严格介于 0 和 1 之间的浮点数,只有当令牌大于 |
[diversity_penalty] | 数字 | 0.0 | 如果一个束在某个特定时间生成的令牌与来自其他组的任何束相同,则从该束的分数中减去此值。请注意, |
[repetition_penalty] | 数字 | 1.0 | 重复惩罚的参数。1.0 表示没有惩罚。有关更多详细信息,请参阅本文。 |
[encoder_repetition_penalty] | 数字 | 1.0 | encoder_repetition_penalty 的参数。对原始输入中不存在的序列施加指数惩罚。1.0 表示没有惩罚。 |
[length_penalty] | 数字 | 1.0 | 对基于束的生成中使用的长度施加指数惩罚。它作为序列长度的指数应用,然后用于除以序列的分数。由于分数是序列的对数似然(即负数), |
[no_repeat_ngram_size] | 数字 | 0 | 如果设置为大于 0 的整数,则该大小的所有 ngrams 只能出现一次。 |
[bad_words_ids] | Array.<Array<number>> |
| 不允许生成的令牌 ID 列表。要获取不应出现在生成文本中的单词的令牌 ID,请使用 |
[force_words_ids] | Array<Array<number>> | Array<Array<Array<number>>> |
| 必须生成的令牌 ID 列表。如果给定 |
[renormalize_logits] | boolean | false | 在应用所有 logits 处理器或扭曲器(包括自定义的)之后是否重新归一化 logits。强烈建议将此标志设置为 |
[constraints] | Array.<Object> |
| 可以添加到生成中的自定义约束,以确保输出将以最合理的方式包含由 |
[forced_bos_token_id] | 数字 |
| 在 |
[forced_eos_token_id] | number | Array<number> |
| 当达到 |
[remove_invalid_values] | boolean | false | 是否删除模型可能产生的*NaN*和*inf*输出,以防止生成方法崩溃。请注意,使用 |
[exponential_decay_length_penalty] | Array.<number> |
| 此元组在生成一定数量的令牌后添加一个指数增长的长度惩罚。该元组应包含: |
[suppress_tokens] | Array.<number> |
| 在生成时将被抑制的令牌列表。 |
[begin_suppress_tokens] | Array.<number> |
| 在生成开始时将被抑制的令牌列表。 |
[forced_decoder_ids] | Array.<Array<number>> |
| 整数对的列表,表示在采样之前将被强制的生成索引到令牌索引的映射。例如, |
[num_return_sequences] | 数字 | 1 | 批处理中每个元素独立计算的返回序列数。 |
[output_attentions] | boolean | false | 是否返回所有注意力层的注意力张量。有关更多详细信息,请参阅返回张量下的 |
[output_hidden_states] | boolean | false | 是否返回所有层的隐藏状态。有关更多详细信息,请参阅返回张量下的 |
[output_scores] | boolean | false | 是否返回预测分数。有关更多详细信息,请参阅返回张量下的 |
[return_dict_in_generate] | boolean | false | 是否返回 |
[pad_token_id] | 数字 |
| *填充*令牌的 ID。 |
[bos_token_id] | 数字 |
| *序列开始*令牌的 ID。 |
[eos_token_id] | number | Array<number> |
| “序列结束”标记的 ID。可选地,使用列表来设置多个“序列结束”标记。 |
[encoder_no_repeat_ngram_size] | 数字 | 0 | 如果设置为大于 0 的整数,则 |
[decoder_start_token_id] | 数字 |
| 如果编码器-解码器模型使用与*bos*不同的令牌开始解码,则该令牌的 ID。 |
[generation_kwargs] | Object | {} | 额外的生成 kwargs 将转发到模型的 |
< > 在 GitHub 上更新