Huggingface.js 文档

界面:选项

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

接口:选项

属性

dont _ load _ model

可选 dont_load_model: 布尔值

(默认值: false)。布尔值。如果模型尚未可用,请不要加载它。

定义于

inference/src/types.ts:16


fetch

可选 fetch: (input: RequestInfo | URL, init?: RequestInit) => Promise\<Response>

自定义 fetch 函数,用于替代默认函数,例如使用代理或编辑标头。

类型声明

▸ (input, init?): Promise\<Response>

参数
名称 类型
input RequestInfo | URL
init? RequestInit
返回值

Promise\<Response>

定义于

inference/src/types.ts:29


includeCredentials

可选 includeCredentials: string | boolean

(默认值:“same-origin”)。字符串 | 布尔值。用于请求的凭据。如果这是一个字符串,它将被直接传递。如果是布尔值,true 将是“include”,而 false 将根本不发送凭据。

定义于

inference/src/types.ts:38


retry_on_error

可选 retry_on_error: boolean

(默认值:true)布尔值。如果请求返回 503 错误且 wait_for_model 设置为 false,则将使用相同的参数重试请求,但将 wait_for_model 设置为 true。

定义于

inference/src/types.ts:8


signal

可选 signal: AbortSignal

用于请求中断的 Abort Controller 信号。

定义于

inference/src/types.ts:33


use _ cache

可选 use_cache: boolean

(默认值:true)。布尔值。推理 API(无服务器)上有一个缓存层,用于加速我们已经见过的请求。大多数模型可以按原样使用这些结果,因为模型是确定性的(这意味着结果无论如何都是相同的)。但是,如果您使用非确定性模型,您可以将此参数设置为阻止使用缓存机制,从而导致真正的新的查询。

定义于

inference/src/types.ts:12


use _ gpu

可选 use_gpu: boolean

(默认值:false)。布尔值,用于使用 GPU 而不是 CPU 进行推理(至少需要启动计划)。

定义于

inference/src/types.ts:20


wait _ for _ model

可选 wait_for_model: boolean

(默认值:false)布尔值。如果模型未准备好,请等待它,而不是收到 503。它限制了完成推理所需的请求次数。建议仅在收到 503 错误后才将此标志设置为 true,因为它会将应用程序中的挂起限制在已知位置。

定义于

inference/src/types.ts:25

< > 在 GitHub 上更新