Diffusers 文档
视频处理器
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
视频处理器
VideoProcessor
为视频 pipelines 提供统一的 API,以准备 VAE 编码的输入,并在解码后进行后处理输出。此类继承了 VaeImageProcessor
,因此它包括调整大小、归一化以及 PIL 图像、PyTorch 和 NumPy 数组之间的转换等转换。
VideoProcessor
diffusers.video_processor.VideoProcessor.preprocess_video
< 源代码 >( 视频 高度: typing.Optional[int] = None 宽度: typing.Optional[int] = None )
参数
- video (
List[PIL.Image]
,List[List[PIL.Image]]
,torch.Tensor
,np.array
,List[torch.Tensor]
,List[np.array]
) — 输入视频。它可以是以下之一:- PIL 图像列表。
- PIL 图像列表的列表。
- 4D Torch 张量(每个张量的预期形状为
(num_frames, num_channels, height, width)
)。 - 4D NumPy 数组(每个数组的预期形状为
(num_frames, height, width, num_channels)
)。 - 4D Torch 张量列表(每个张量的预期形状为
(num_frames, num_channels, height, width)
)。 - 4D NumPy 数组列表(每个数组的预期形状为
(num_frames, height, width, num_channels)
)。 - 5D NumPy 数组:每个数组的预期形状为
(batch_size, num_frames, height, width, num_channels)
。 - 5D Torch 张量:每个数组的预期形状为
(batch_size, num_frames, num_channels, height, width)
。
- height (
int
, 可选,默认为None
) — 视频预处理帧的高度。如果为None
,将使用get_default_height_width()
获取默认高度。 - width (
int
, 可选, defaults to
None) -- 视频预处理帧的宽度。如果为
None, 将使用 get_default_height_width()
获取默认宽度。
预处理输入视频。
diffusers.video_processor.VideoProcessor.postprocess_video
< 源代码 >( 视频: Tensor 输出类型: str = 'np' )
将视频张量转换为帧列表以进行导出。