接口:选项
属性
dont _ load _ model
• 可选
dont_load_model: 布尔值
(默认值: false)。布尔值。如果模型尚未可用,请不要加载它。
定义于
fetch
• 可选
fetch: (input
: RequestInfo
| URL
, init?
: RequestInit
) => Promise
\<Response
>
自定义 fetch 函数,用于替代默认函数,例如使用代理或编辑标头。
类型声明
▸ (input
, init?
): Promise
\<Response
>
参数
名称 | 类型 |
---|---|
input | RequestInfo | URL |
init? | RequestInit |
返回值
Promise
\<Response
>
定义于
includeCredentials
• 可选
includeCredentials: string
| boolean
(默认值:“same-origin”)。字符串 | 布尔值。用于请求的凭据。如果这是一个字符串,它将被直接传递。如果是布尔值,true 将是“include”,而 false 将根本不发送凭据。
定义于
retry_on_error
• 可选
retry_on_error: boolean
(默认值:true)布尔值。如果请求返回 503 错误且 wait_for_model 设置为 false,则将使用相同的参数重试请求,但将 wait_for_model 设置为 true。
定义于
signal
• 可选
signal: AbortSignal
用于请求中断的 Abort Controller 信号。
定义于
use _ cache
• 可选
use_cache: boolean
(默认值:true)。布尔值。推理 API(无服务器)上有一个缓存层,用于加速我们已经见过的请求。大多数模型可以按原样使用这些结果,因为模型是确定性的(这意味着结果无论如何都是相同的)。但是,如果您使用非确定性模型,您可以将此参数设置为阻止使用缓存机制,从而导致真正的新的查询。
定义于
use _ gpu
• 可选
use_gpu: boolean
(默认值:false)。布尔值,用于使用 GPU 而不是 CPU 进行推理(至少需要启动计划)。
定义于
wait _ for _ model
• 可选
wait_for_model: boolean
(默认值:false)布尔值。如果模型未准备好,请等待它,而不是收到 503。它限制了完成推理所需的请求次数。建议仅在收到 503 错误后才将此标志设置为 true,因为它会将应用程序中的挂起限制在已知位置。