Diffusers

加入 Hugging Face 社区

并获得增强的文档体验

在模型、数据集和 Spaces 上进行协作

通过加速推理获得更快的示例

切换文档主题

开始使用

视频处理器

VideoProcessor 为视频管道提供统一的 API，用于准备 VAE 编码的输入和解码后处理输出。该类继承自 VaeImageProcessor，因此它包含大小调整、归一化以及 PIL Image、PyTorch 和 NumPy 数组之间的转换等操作。

( video height: typing.Optional[int] = None width: typing.Optional[int] = None )

参数

video (List[PIL.Image], List[List[PIL.Image]], torch.Tensor, np.array, List[torch.Tensor], List[np.array]) — 输入视频。可以是以下任意一种：
- PIL 图像列表。
- PIL 图像列表的列表。
- 4D Torch 张量（每个张量的预期形状为 (num_frames, num_channels, height, width)）。
- 4D NumPy 数组（每个数组的预期形状为 (num_frames, height, width, num_channels)）。
- 4D Torch 张量列表（每个张量的预期形状为 (num_frames, num_channels, height, width)）。
- 4D NumPy 数组列表（每个数组的预期形状为 (num_frames, height, width, num_channels)）。
- 5D NumPy 数组：每个数组的预期形状为 (batch_size, num_frames, height, width, num_channels)。
- 5D Torch 张量：每个数组的预期形状为 (batch_size, num_frames, num_channels, height, width)。
height (int, 可选, 默认为 None) — 视频预处理帧的高度。如果为 None，将使用 get_default_height_width() 获取默认高度。
width (int, 可选, 默认为 None) -- 视频预处理帧的宽度。如果为 None，将使用 get_default_height_width() 获取默认宽度。

预处理输入视频。

( video: Tensor output_type: str = 'np' )

参数

将视频张量转换为帧列表以供导出。