推理提供商文档
文本到视频
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
文本转视频
根据给定的文本提示生成视频。
有关
text-to-video任务的更多详细信息,请查看其 专用页面!您可以在那里找到示例和相关材料。
推荐模型
- tencent/HunyuanVideo:一个强大的视频一致性生成模型。
- Lightricks/LTX-Video:一个具有高保真运动和强大提示遵循能力的文本到视频模型。
- Lightricks/LTX-Video-0.9.8-13B-distilled:一个非常快速的视频生成模型。
在此处 探索所有可用模型,找到最适合您的模型。
使用 API
语言
提供商
import os
from huggingface_hub import InferenceClient
client = InferenceClient(
provider="fal-ai",
api_key=os.environ["HF_TOKEN"],
)
video = client.text_to_video(
"A young man walking on the street",
model="tencent/HunyuanVideo-1.5",
)API 规范
请求
| 有效负载 | ||
|---|---|---|
| inputs* | 字符串 | 输入文本数据(有时称为“提示”) |
| 参数 | 对象 | |
| num_frames | 数字 | num_frames 参数决定生成多少帧视频。 |
| guidance_scale | 数字 | 更高的引导尺度值会鼓励模型生成与文本提示紧密相关的视频,但过高的值可能会导致饱和和其他伪影。 |
| negative_prompt | 字符串数组 | 一个或多个提示,用于指导视频生成中不应包含的内容。 |
| num_inference_steps | 整数 | 去噪步数。更多的去噪步数通常能带来更高的视频质量,但推理速度会变慢。 |
| seed | 整数 | 随机数生成器的种子。 |
| 标头 | ||
|---|---|---|
| 授权 | 字符串 | 身份验证头,格式为 'Bearer: hf_****',其中 hf_**** 是具有“推理提供者”权限的个人用户访问令牌。您可以从您的设置页面生成一个。 |
响应
| 正文 | ||
|---|---|---|
| video | 未知 | 生成的视频以原始字节形式返回。 |