推理提供商文档

文本到视频

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

文本转视频

根据给定的文本提示生成视频。

有关 text-to-video 任务的更多详细信息,请查看其 专用页面!您可以在那里找到示例和相关材料。

推荐模型

在此处 探索所有可用模型,找到最适合您的模型。

使用 API

import os
from huggingface_hub import InferenceClient

client = InferenceClient(
    provider="fal-ai",
    api_key=os.environ["HF_TOKEN"],
)

video = client.text_to_video(
    "A young man walking on the street",
    model="tencent/HunyuanVideo-1.5",
)

API 规范

请求

有效负载
inputs* 字符串 输入文本数据(有时称为“提示”)
参数 对象
        num_frames 数字 num_frames 参数决定生成多少帧视频。
        guidance_scale 数字 更高的引导尺度值会鼓励模型生成与文本提示紧密相关的视频,但过高的值可能会导致饱和和其他伪影。
        negative_prompt 字符串数组 一个或多个提示,用于指导视频生成中不应包含的内容。
        num_inference_steps 整数 去噪步数。更多的去噪步数通常能带来更高的视频质量,但推理速度会变慢。
        seed 整数 随机数生成器的种子。
标头
授权 字符串 身份验证头,格式为 'Bearer: hf_****',其中 hf_**** 是具有“推理提供者”权限的个人用户访问令牌。您可以从您的设置页面生成一个。

响应

正文
video 未知 生成的视频以原始字节形式返回。
在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.