Diffusers 文档
视频处理器
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
视频处理器
VideoProcessor 为视频管道提供统一的 API,用于准备 VAE 编码的输入和解码后处理输出。该类继承自 VaeImageProcessor,因此它包含大小调整、归一化以及 PIL Image、PyTorch 和 NumPy 数组之间的转换等操作。
VideoProcessor
diffusers.video_processor.VideoProcessor.preprocess_video
< 源 >( video height: typing.Optional[int] = None width: typing.Optional[int] = None )
参数
- video (
List[PIL.Image],List[List[PIL.Image]],torch.Tensor,np.array,List[torch.Tensor],List[np.array]) — 输入视频。可以是以下任意一种:- PIL 图像列表。
- PIL 图像列表的列表。
- 4D Torch 张量(每个张量的预期形状为
(num_frames, num_channels, height, width))。 - 4D NumPy 数组(每个数组的预期形状为
(num_frames, height, width, num_channels))。 - 4D Torch 张量列表(每个张量的预期形状为
(num_frames, num_channels, height, width))。 - 4D NumPy 数组列表(每个数组的预期形状为
(num_frames, height, width, num_channels))。 - 5D NumPy 数组:每个数组的预期形状为
(batch_size, num_frames, height, width, num_channels)。 - 5D Torch 张量:每个数组的预期形状为
(batch_size, num_frames, num_channels, height, width)。
- height (
int, 可选, 默认为None) — 视频预处理帧的高度。如果为None,将使用get_default_height_width()获取默认高度。 - width (
int, 可选, 默认为None) -- 视频预处理帧的宽度。如果为None,将使用 get_default_height_width()获取默认宽度。
预处理输入视频。
diffusers.video_processor.VideoProcessor.postprocess_video
< 源 >( video: Tensor output_type: str = 'np' )
将视频张量转换为帧列表以供导出。