utils/generation
用于生成的类、函数和实用工具。
待办事项
- 描述如何创建自定义
GenerationConfig
。
- utils/generation
- 静态
- .LogitsProcessorList ⇐
Callable
- .LogitsProcessor ⇐
Callable
- .ForceTokensLogitsProcessor ⇐
LogitsProcessor
- .ForcedBOSTokenLogitsProcessor ⇐
LogitsProcessor
- .ForcedEOSTokenLogitsProcessor ⇐
LogitsProcessor
- .SuppressTokensAtBeginLogitsProcessor ⇐
LogitsProcessor
- .WhisperTimeStampLogitsProcessor ⇐
LogitsProcessor
- .NoRepeatNGramLogitsProcessor ⇐
LogitsProcessor
new NoRepeatNGramLogitsProcessor(no_repeat_ngram_size)
.getNgrams(prevInputIds)
⇒Map.<string, Array<number>>
.getGeneratedNgrams(bannedNgrams, prevInputIds)
⇒Array.<number>
.calcBannedNgramTokens(prevInputIds)
⇒Array.<number>
._call(input_ids, logits)
⇒Object
- .RepetitionPenaltyLogitsProcessor ⇐
LogitsProcessor
- .MinLengthLogitsProcessor ⇐
LogitsProcessor
- .MinNewTokensLengthLogitsProcessor ⇐
LogitsProcessor
- .NoBadWordsLogitsProcessor
- .Sampler
new Sampler(generation_config)
- 实例
._call(logits, index)
⇒void
.sample(logits, index)
.getLogits(logits, index)
⇒Float32Array
.randomSelect(probabilities)
⇒number
- 静态
.getSampler(generation_config)
⇒Sampler
.GenerationConfig
:*
- .LogitsProcessorList ⇐
- 内部
- ~GenerationConfig
- ~GreedySampler ⇐
Sampler
.sample(logits, [index])
⇒Array
- ~MultinomialSampler ⇐
Sampler
.sample(logits, index)
⇒Array
- ~BeamSearchSampler ⇐
Sampler
.sample(logits, index)
⇒Array
~GenerationConfigType
:Object
- 静态
utils/generation.LogitsProcessorList ⇐ Callable
一个类,表示 logits 处理器的列表。logits 处理器是一个函数,用于修改语言模型的 logits 输出。此类提供用于添加新处理器和将所有处理器应用于一批 logits 的方法。
类型:静态类,属于 utils/generation
继承自:Callable
- .LogitsProcessorList ⇐
Callable
new LogitsProcessorList()
构造 LogitsProcessorList
的新实例。
logitsProcessorList.push(item)
向列表中添加新的 logits 处理器。
类型:LogitsProcessorList
的实例方法
参数 | 类型 | 描述 |
---|---|---|
item | LogitsProcessor | 要添加的 logits 处理器函数。 |
logitsProcessorList.extend(items)
向列表中添加多个 logits 处理器。
类型:LogitsProcessorList
的实例方法
参数 | 类型 | 描述 |
---|---|---|
items | Array.<LogitsProcessor> | 要添加的 logits 处理器函数。 |
logitsProcessorList._call(input_ids, batchedLogits)
将列表中的所有 logits 处理器应用于一批 logits,就地修改它们。
类型:LogitsProcessorList
的实例方法
参数 | 类型 | 描述 |
---|---|---|
input_ids | Array.<number> | 语言模型的输入 ID。 |
batchedLogits | Array.<Array<number>> | logits 的二维数组,其中每一行对应于批处理中的单个输入序列。 |
utils/generation.LogitsProcessor ⇐ Callable
用于处理 logits 的基类。
类型:静态类,属于 utils/generation
继承自:Callable
logitsProcessor._call(input_ids, logits)
将处理器应用于输入 logits。
类型:LogitsProcessor
的实例抽象方法
抛出:
Error
如果在子类中未实现_call
,则抛出错误。
参数 | 类型 | 描述 |
---|---|---|
input_ids | Array | 输入 id。 |
logits | Tensor | 要处理的 logits。 |
utils/generation.ForceTokensLogitsProcessor ⇐ LogitsProcessor
一个 logits 处理器,强制解码器生成特定的 token。
类型:静态类,属于 utils/generation
继承自:LogitsProcessor
- .ForceTokensLogitsProcessor ⇐
LogitsProcessor
new ForceTokensLogitsProcessor(forced_decoder_ids)
构造 ForceTokensLogitsProcessor
的新实例。
参数 | 类型 | 描述 |
---|---|---|
forced_decoder_ids | Array | 应强制执行的 token 的 id。 |
forceTokensLogitsProcessor._call(input_ids, logits) ⇒ Tensor
将处理器应用于输入 logits。
类型:ForceTokensLogitsProcessor
的实例方法
返回值:Tensor
- 处理后的 logits。
参数 | 类型 | 描述 |
---|---|---|
input_ids | Array | 输入 id。 |
logits | Tensor | 要处理的 logits。 |
utils/generation.ForcedBOSTokenLogitsProcessor ⇐ LogitsProcessor
一个 LogitsProcessor,它强制在生成的序列开头添加 BOS token。
类型:静态类,属于 utils/generation
继承自:LogitsProcessor
- .ForcedBOSTokenLogitsProcessor ⇐
LogitsProcessor
new ForcedBOSTokenLogitsProcessor(bos_token_id)
创建 ForcedBOSTokenLogitsProcessor。
参数 | 类型 | 描述 |
---|---|---|
bos_token_id | number | 要强制执行的序列开始 token 的 ID。 |
forcedBOSTokenLogitsProcessor._call(input_ids, logits) ⇒ Object
将 BOS token 强制应用于 logits。
类型:ForcedBOSTokenLogitsProcessor
的实例方法
返回值:Object
- 具有 BOS token 强制的 logits。
参数 | 类型 | 描述 |
---|---|---|
input_ids | Array | 输入 ID。 |
logits | Object | logits。 |
utils/generation.ForcedEOSTokenLogitsProcessor ⇐ LogitsProcessor
一个 logits 处理器,它强制将序列结束 token 的概率设为 1。
类型:静态类,属于 utils/generation
继承自:LogitsProcessor
- .ForcedEOSTokenLogitsProcessor ⇐
LogitsProcessor
new ForcedEOSTokenLogitsProcessor(max_length, forced_eos_token_id)
创建 ForcedEOSTokenLogitsProcessor。
参数 | 类型 | 描述 |
---|---|---|
max_length | number | 序列的最大长度。 |
forced_eos_token_id | number | Array.<number> | 要强制执行的序列结束 token 的 ID。 |
forcedEOSTokenLogitsProcessor._call(input_ids, logits)
将处理器应用于 input_ids 和 logits。
类型:ForcedEOSTokenLogitsProcessor
的实例方法
参数 | 类型 | 描述 |
---|---|---|
input_ids | Array.<number> | 输入 id。 |
logits | Tensor | logits tensor。 |
utils/generation.SuppressTokensAtBeginLogitsProcessor ⇐ LogitsProcessor
一个 LogitsProcessor,当 generate
函数开始使用 begin_index
token 生成时,它会抑制 token 列表。这应确保由 begin_suppress_tokens
定义的 token 在生成开始时不会被采样。
类型:静态类,属于 utils/generation
继承自:LogitsProcessor
- .SuppressTokensAtBeginLogitsProcessor ⇐
LogitsProcessor
new SuppressTokensAtBeginLogitsProcessor(begin_suppress_tokens, begin_index)
创建 SuppressTokensAtBeginLogitsProcessor。
参数 | 类型 | 描述 |
---|---|---|
begin_suppress_tokens | Array.<number> | 要抑制的 token 的 ID。 |
begin_index | number | 在抑制 token 之前要生成的 token 数。 |
suppressTokensAtBeginLogitsProcessor._call(input_ids, logits) ⇒ Object
将 BOS token 强制应用于 logits。
类型:SuppressTokensAtBeginLogitsProcessor
的实例方法
返回值:Object
- 具有 BOS token 强制的 logits。
参数 | 类型 | 描述 |
---|---|---|
input_ids | Array | 输入 ID。 |
logits | Object | logits。 |
utils/generation.WhisperTimeStampLogitsProcessor ⇐ <code> LogitsProcessor </code>
处理向生成的文本添加时间戳的 LogitsProcessor。
类型:静态类,属于 utils/generation
继承自:LogitsProcessor
- .WhisperTimeStampLogitsProcessor ⇐
LogitsProcessor
new WhisperTimeStampLogitsProcessor(generate_config)
构造一个新的 WhisperTimeStampLogitsProcessor。
参数 | 类型 | 描述 |
---|---|---|
generate_config | Object | 传递给 transformer 模型的 |
generate_config.eos_token_id | number | 序列结束 (end-of-sequence) 标记的 ID。 |
generate_config.no_timestamps_token_id | number | 用于指示标记不应具有时间戳的标记 ID。 |
[generate_config.forced_decoder_ids] | Array.<Array<number>> | 表示强制出现在输出中的解码器 ID 的双元素数组的数组。 每个数组的第二个元素指示标记是否为时间戳。 |
[generate_config.max_initial_timestamp_index] | number | 初始时间戳可以出现的最大索引。 |
whisperTimeStampLogitsProcessor._call(input_ids, logits) ⇒ <code> Tensor </code>
修改 logits 以处理时间戳标记。
Kind: WhisperTimeStampLogitsProcessor
的实例方法
Returns: Tensor
- 修改后的 logits。
参数 | 类型 | 描述 |
---|---|---|
input_ids | Array | 标记的输入序列。 |
logits | Tensor | 模型输出的 logits。 |
utils/generation.NoRepeatNGramLogitsProcessor ⇐ <code> LogitsProcessor </code>
一个 logits 处理器,禁止重复出现特定大小的 n-gram。
类型:静态类,属于 utils/generation
继承自:LogitsProcessor
- .NoRepeatNGramLogitsProcessor ⇐
LogitsProcessor
new NoRepeatNGramLogitsProcessor(no_repeat_ngram_size)
.getNgrams(prevInputIds)
⇒Map.<string, Array<number>>
.getGeneratedNgrams(bannedNgrams, prevInputIds)
⇒Array.<number>
.calcBannedNgramTokens(prevInputIds)
⇒Array.<number>
._call(input_ids, logits)
⇒Object
new NoRepeatNGramLogitsProcessor(no_repeat_ngram_size)
创建一个 NoRepeatNGramLogitsProcessor。
参数 | 类型 | 描述 |
---|---|---|
no_repeat_ngram_size | number | no-repeat-ngram 大小。 此大小的所有 n-gram 只能出现一次。 |
noRepeatNGramLogitsProcessor.getNgrams(prevInputIds) ⇒ <code> Map. < string, Array < number > > </code>
从标记 ID 序列生成 n-gram。
Kind: NoRepeatNGramLogitsProcessor
的实例方法
Returns: Map.<string, Array<number>>
- 生成的 n-gram 的 Map
参数 | 类型 | 描述 |
---|---|---|
prevInputIds | Array.<number> | 先前的输入 ID 列表 |
noRepeatNGramLogitsProcessor.getGeneratedNgrams(bannedNgrams, prevInputIds) ⇒ <code> Array. < number > </code>
从标记 ID 序列生成 n-gram。
Kind: NoRepeatNGramLogitsProcessor
的实例方法
Returns: Array.<number>
- 生成的 n-gram 的 Map
参数 | 类型 | 描述 |
---|---|---|
bannedNgrams | Map.<string, Array<number>> | 禁止的 n-gram 的 Map |
prevInputIds | Array.<number> | 先前的输入 ID 列表 |
noRepeatNGramLogitsProcessor.calcBannedNgramTokens(prevInputIds) ⇒ <code> Array. < number > </code>
计算禁止的 n-gram 标记
Kind: NoRepeatNGramLogitsProcessor
的实例方法
Returns: Array.<number>
- 生成的 n-gram 的 Map
参数 | 类型 | 描述 |
---|---|---|
prevInputIds | Array.<number> | 先前的输入 ID 列表 |
noRepeatNGramLogitsProcessor._call(input_ids, logits) ⇒ <code> Object </code>
将 no-repeat-ngram 处理器应用于 logits。
Kind: NoRepeatNGramLogitsProcessor
的实例方法
Returns: Object
- 经过 no-repeat-ngram 处理的 logits。
参数 | 类型 | 描述 |
---|---|---|
input_ids | Array | 输入 ID。 |
logits | Object | logits。 |
utils/generation.RepetitionPenaltyLogitsProcessor ⇐ <code> LogitsProcessor </code>
一个 logits 处理器,用于惩罚重复输出的标记。
类型:静态类,属于 utils/generation
继承自:LogitsProcessor
- .RepetitionPenaltyLogitsProcessor ⇐
LogitsProcessor
new RepetitionPenaltyLogitsProcessor(penalty)
创建一个 RepetitionPenaltyLogitsProcessor。
参数 | 类型 | 描述 |
---|---|---|
penalty | number | 应用于重复标记的惩罚。 |
repetitionPenaltyLogitsProcessor._call(input_ids, logits) ⇒ <code> Object </code>
将重复惩罚应用于 logits。
Kind: RepetitionPenaltyLogitsProcessor
的实例方法
Returns: Object
- 经过重复惩罚处理的 logits。
参数 | 类型 | 描述 |
---|---|---|
input_ids | Array | 输入 ID。 |
logits | Object | logits。 |
utils/generation.MinLengthLogitsProcessor ⇐ <code> LogitsProcessor </code>
一个 logits 处理器,强制执行最少标记数。
类型:静态类,属于 utils/generation
继承自:LogitsProcessor
- .MinLengthLogitsProcessor ⇐
LogitsProcessor
new MinLengthLogitsProcessor(min_length, eos_token_id)
创建一个 MinLengthLogitsProcessor。
参数 | 类型 | 描述 |
---|---|---|
min_length | number | 低于此最小长度, |
eos_token_id | number | Array.<number> | 序列结束标记的 ID/ID 列表。 |
minLengthLogitsProcessor._call(input_ids, logits) ⇒ <code> Object </code>
应用 logits 处理器。
Kind: MinLengthLogitsProcessor
的实例方法
Returns: Object
- 处理后的 logits。
参数 | 类型 | 描述 |
---|---|---|
input_ids | Array | 输入 ID。 |
logits | Object | logits。 |
utils/generation.MinNewTokensLengthLogitsProcessor ⇐ <code> LogitsProcessor </code>
一个 logits 处理器,强制执行最少新标记数。
类型:静态类,属于 utils/generation
继承自:LogitsProcessor
- .MinNewTokensLengthLogitsProcessor ⇐
LogitsProcessor
new MinNewTokensLengthLogitsProcessor(prompt_length_to_skip, min_new_tokens, eos_token_id)
创建一个 MinNewTokensLengthLogitsProcessor。
参数 | 类型 | 描述 |
---|---|---|
prompt_length_to_skip | number | 输入标记长度。 |
min_new_tokens | number | 低于此最小新标记长度, |
eos_token_id | number | Array.<number> | 序列结束标记的 ID/ID 列表。 |
minNewTokensLengthLogitsProcessor._call(input_ids, logits) ⇒ <code> Object </code>
应用 logits 处理器。
Kind: MinNewTokensLengthLogitsProcessor
的实例方法
Returns: Object
- 处理后的 logits。
参数 | 类型 | 描述 |
---|---|---|
input_ids | Array | 输入 ID。 |
logits | Object | logits。 |
utils/generation.NoBadWordsLogitsProcessor
类型:静态类,属于 utils/generation
new NoBadWordsLogitsProcessor(bad_words_ids, eos_token_id)
创建一个 NoBadWordsLogitsProcessor
。
参数 | 类型 | 描述 |
---|---|---|
bad_words_ids | Array.<Array<number>> | 不允许生成的标记 ID 列表的列表。 |
eos_token_id | number | Array.<number> | 序列结束标记的 ID。 (可选)使用列表来设置多个序列结束标记。 |
noBadWordsLogitsProcessor._call(input_ids, logits) ⇒ <code> Object </code>
应用 logits 处理器。
Kind: NoBadWordsLogitsProcessor
的实例方法
Returns: Object
- 处理后的 logits。
参数 | 类型 | 描述 |
---|---|---|
input_ids | Array | 输入 ID。 |
logits | Object | logits。 |
utils/generation.Sampler
Sampler 是用于文本生成的所有采样方法的基础类。
类型:静态类,属于 utils/generation
- .Sampler
new Sampler(generation_config)
- 实例
._call(logits, index)
⇒void
.sample(logits, index)
.getLogits(logits, index)
⇒Float32Array
.randomSelect(probabilities)
⇒number
- 静态
.getSampler(generation_config)
⇒Sampler
new Sampler(generation_config)
使用指定的生成配置创建一个新的 Sampler 对象。
参数 | 类型 | 描述 |
---|---|---|
generation_config | GenerationConfigType | 生成配置。 |
sampler._call(logits, index) ⇒ <code> void </code>
执行 sampler,使用指定的 logits。
Kind: Sampler
的实例方法
参数 | 类型 |
---|---|
logits | Tensor |
index | number |
sampler.sample(logits, index)
用于采样 logits 的抽象方法。
Kind: Sampler
的实例方法
抛出:
Error
参数 | 类型 |
---|---|
logits | Tensor |
index | number |
sampler.getLogits(logits, index) ⇒ <code> Float32Array </code>
返回指定的 logits 作为数组,并应用温度系数。
Kind: Sampler
的实例方法
参数 | 类型 |
---|---|
logits | Tensor |
index | number |
sampler.randomSelect(probabilities) ⇒ <code> number </code>
基于指定的概率随机选择一个项目。
Kind: Sampler
的实例方法
返回值: number
- 所选项目的索引。
参数 | 类型 | 描述 |
---|---|---|
probabilities | Array | 用于选择的概率数组。 |
Sampler.getSampler(generation_config) ⇒ <code> Sampler </code>
基于指定的选项返回一个 Sampler 对象。
类型: Sampler
的静态方法
返回值: Sampler
- 一个 Sampler 对象。
参数 | 类型 | 描述 |
---|---|---|
generation_config | GenerationConfigType | 包含采样器选项的对象。 |
utils/generation.GenerationConfig : <code> * </code>
用于保存生成任务配置的类。
类型: utils/generation
的静态常量
utils/generation~GenerationConfig
类型: utils/generation
的内部类
new GenerationConfig(kwargs)
创建一个新的 GenerationConfig 对象。
参数 | 类型 |
---|---|
kwargs | GenerationConfigType |
utils/generation~GreedySampler ⇐ <code> Sampler </code>
表示贪婪采样器的类。
类型: utils/generation
的内部类
继承自: Sampler
greedySampler.sample(logits, [index]) ⇒ <code> Array </code>
对给定 logits 张量的最大概率进行采样。
类型: GreedySampler
的实例方法
返回值: Array
- 包含单个元组的数组,其中包含最大值的索引和一个无意义的分数(因为这是贪婪搜索)。
参数 | 类型 | 默认值 |
---|---|---|
logits | Tensor | |
[index] | number | -1 |
utils/generation~MultinomialSampler ⇐ <code> Sampler </code>
表示多项式采样器的类。
类型: utils/generation
的内部类
继承自: Sampler
multinomialSampler.sample(logits, index) ⇒ <code> Array </code>
从 logits 中采样。
类型: MultinomialSampler
的实例方法
参数 | 类型 |
---|---|
logits | Tensor |
index | number |
utils/generation~BeamSearchSampler ⇐ <code> Sampler </code>
表示束搜索采样器的类。
类型: utils/generation
的内部类
继承自: Sampler
beamSearchSampler.sample(logits, index) ⇒ <code> Array </code>
从 logits 中采样。
类型: BeamSearchSampler
的实例方法
参数 | 类型 |
---|---|
logits | Tensor |
index | number |
utils/generation~GenerationConfigType : <code> Object </code>
默认配置参数。
类型: utils/generation
的内部类型定义
属性
名称 | 类型 | 默认值 | 描述 |
---|---|---|---|
[max_length] | number | 20 | 生成的 token 可以拥有的最大长度。对应于输入提示的长度 + |
[max_new_tokens] | number |
| 要生成的最大 token 数量,忽略提示中的 token 数量。 |
[min_length] | number | 0 | 要生成的序列的最小长度。对应于输入提示的长度 + |
[min_new_tokens] | number |
| 要生成的最小 token 数量,忽略提示中的 token 数量。 |
[early_stopping] | boolean | "never" | false | 控制基于 beam 的方法(如束搜索)的停止条件。它接受以下值
|
[max_time] | number |
| 您允许计算运行的最大时间量(以秒为单位)。即使超过分配的时间,生成仍然会完成当前的传递。 |
[do_sample] | boolean | false | 是否使用采样;否则使用贪婪解码。 |
[num_beams] | number | 1 | 束搜索的束数量。1 表示不进行束搜索。 |
[num_beam_groups] | number | 1 | 为确保不同束组之间的多样性,将 |
[penalty_alpha] | number |
| 这些值平衡了对比搜索解码中的模型置信度和退化惩罚。 |
[use_cache] | boolean | true | 模型是否应使用过去的最后一个键/值注意力(如果适用于模型)来加速解码。 |
[temperature] | number | 1.0 | 用于调节下一个 token 概率的值。 |
[top_k] | number | 50 | 为 top-k 过滤保留的最高概率词汇 token 的数量。 |
[top_p] | number | 1.0 | 如果设置为小于 1 的浮点数,则仅保留概率总和达到或高于 |
[typical_p] | number | 1.0 | 局部典型性衡量预测目标 token 的条件概率与预测下一个随机 token 的预期条件概率的相似程度,给定已生成的局部文本。如果设置为小于 1 的浮点数,则仅保留概率总和达到或高于 |
[epsilon_cutoff] | number | 0.0 | 如果设置为严格介于 0 和 1 之间的浮点数,则仅对条件概率大于 |
[eta_cutoff] | number | 0.0 | Eta 采样是局部典型采样和 epsilon 采样的混合体。如果设置为严格介于 0 和 1 之间的浮点数,则仅当 token 大于 |
[diversity_penalty] | number | 0.0 | 如果束在特定时间生成与来自其他组的任何束相同的 token,则此值将从该束的分数中减去。请注意,仅当启用 |
[repetition_penalty] | number | 1.0 | 重复惩罚的参数。1.0 表示没有惩罚。有关更多详细信息,请参阅 本文。 |
[encoder_repetition_penalty] | number | 1.0 | encoder_repetition_penalty 的参数。对不在原始输入中的序列进行指数惩罚。1.0 表示没有惩罚。 |
[length_penalty] | number | 1.0 | 与基于束的生成一起使用的长度的指数惩罚。它作为序列长度的指数应用,而序列长度又用于除以序列的分数。由于分数是序列的对数似然(即负数),因此 |
[no_repeat_ngram_size] | number | 0 | 如果设置为 int > 0,则该大小的所有 n-gram 只能出现一次。 |
[bad_words_ids] | Array.<Array<number>> |
| 不允许生成的 token id 列表。为了获得不应出现在生成文本中的单词的 token id,请使用 |
[force_words_ids] | Array<Array<number>> | Array<Array<Array<number>>> |
| 必须生成的 token id 列表。如果给定 |
[renormalize_logits] | boolean | false | 是否在应用所有 logits 处理器或变形器(包括自定义处理器或变形器)后重新规范化 logits。强烈建议将此标志设置为 |
[constraints] | Array.<Object> |
| 可以添加到生成的自定义约束,以确保输出将以最合理的方式包含由 |
[forced_bos_token_id] | number |
| 强制作为 |
[forced_eos_token_id] | number | Array.<number> |
| 当达到 |
[remove_invalid_values] | boolean | false | 是否删除模型可能存在的 nan 和 inf 输出,以防止生成方法崩溃。请注意,使用 |
[exponential_decay_length_penalty] | Array.<number> |
| 此元组在生成一定数量的 token 后添加指数增长的长度惩罚。该元组应包含: |
[suppress_tokens] | Array.<number> |
| 将在生成时被抑制的 token 列表。 |
[begin_suppress_tokens] | Array.<number> |
| 将在生成开始时被抑制的 token 列表。 |
[forced_decoder_ids] | Array.<Array<number>> |
| 一个整数对列表,指示从生成索引到将在采样之前强制执行的 token 索引的映射。例如, |
[num_return_sequences] | number | 1 | 批次中每个元素独立计算的返回序列的数量。 |
[output_attentions] | boolean | false | 是否返回所有注意力层的注意力张量。有关更多详细信息,请参阅返回张量下的 |
[output_hidden_states] | boolean | false | 是否返回所有层的隐藏状态。有关更多详细信息,请参阅返回张量下的 |
[output_scores] | boolean | false | 是否返回预测分数。有关更多详细信息,请参阅返回张量下的 |
[return_dict_in_generate] | boolean | false | 是否返回 |
[pad_token_id] | number |
| 填充 token 的 id。 |
[bos_token_id] | number |
| 序列开始 token 的 id。 |
[eos_token_id] | number | Array.<number> |
| 序列结束标记的 ID。 (可选)使用列表来设置多个序列结束标记。 |
[encoder_no_repeat_ngram_size] | number | 0 | 如果设置为 int > 0,则 |
[decoder_start_token_id] | number |
| 如果编码器-解码器模型以与 bos 不同的 token 开始解码,则该 token 的 id。 |
[generation_kwargs] | Object | {} | 其他生成 kwargs 将转发到模型的 |
< > 在 GitHub 上更新