Diffusers 文档

输出

Hugging Face's logo
加入 Hugging Face 社区

并获取增强文档体验

开始使用

输出

所有模型输出都是 BaseOutput 的子类,数据结构包含模型返回的所有信息。输出也可以用作元组或字典。

例如

from diffusers import DDIMPipeline

pipeline = DDIMPipeline.from_pretrained("google/ddpm-cifar10-32")
outputs = pipeline()

outputs 对象是 ImagePipelineOutput,这意味着它具有一个图像属性。

您可以像平时一样或使用关键字查找访问每个属性,如果模型没有返回该属性,您将获得None

outputs.images
outputs["images"]

当将outputs对象视为元组时,它只考虑不具有None值的属性。例如,通过索引到其中检索图像会返回元组(outputs.images)

outputs[:1]

要检查特定的管道或模型输出,请参阅其相应的 API 文档。

BaseOutput

diffusers.utils.BaseOutput

< >

( )

所有模型输出作为数据类的基类。具有一个__getitem__,允许通过整数或切片(如元组)或字符串(如字典)进行索引,这些索引将忽略None属性。否则表现得像一个普通的 Python 字典。

您不能直接解包BaseOutput。首先使用to_tuple()方法将其转换为元组。

to_tuple

< >

( )

将自身转换为一个元组,其中包含所有不为None的属性/键。

ImagePipelineOutput

diffusers.ImagePipelineOutput

< >

( images: Union )

参数

  • images (List[PIL.Image.Image]np.ndarray) — 长度为batch_size 的去噪 PIL 图像列表或形状为(batch_size, height, width, num_channels) 的 NumPy 数组。

图像管道的输出类。

FlaxImagePipelineOutput

diffusers.pipelines.pipeline_flax_utils.FlaxImagePipelineOutput

  • images (List[PIL.Image.Image]np.ndarray) — 长度为 batch_size 的去噪 PIL 图像列表或形状为 (batch_size, height, width, num_channels) 的 NumPy 数组。

图像管道的输出类。

替换

< >

( **updates )

“返回一个新的对象,用新值替换指定的字段。

AudioPipelineOutput

diffusers.AudioPipelineOutput

< >

( audios: ndarray )

参数

  • audios (np.ndarray) — 形状为 (batch_size, num_channels, sample_rate) 的 NumPy 数组,表示去噪音频样本列表。

音频管道输出类。

ImageTextPipelineOutput

diffusers.ImageTextPipelineOutput

< >

( images: Union text: Union )

参数

  • images (List[PIL.Image.Image]np.ndarray) — 长度为 batch_size 的去噪 PIL 图像列表或形状为 (batch_size, height, width, num_channels) 的 NumPy 数组。
  • text (List[str]List[List[str]]) — 长度为 batch_size 的生成的文本字符串列表,或一个字符串列表的列表,其外部列表的长度为 batch_size

联合图像-文本管道的输出类。

< > 在 GitHub 上更新