Diffusers 文档

注意力处理器

Diffusers

加入 Hugging Face 社区

并获得增强的文档体验

在模型、数据集和 Spaces 上协作

通过加速推理获得更快的示例

在文档主题之间切换

开始使用

Attention Processor

注意力处理器是一个用于应用不同类型注意力机制的类。

AttnProcessor

class diffusers.models.attention_processor.AttnProcessor

< source >

( )

用于执行注意力相关计算的默认处理器。

class diffusers.models.attention_processor.AttnProcessor2_0

< source >

( )

用于实现缩放点积注意力（如果您正在使用 PyTorch 2.0，则默认启用）的处理器。

class diffusers.models.attention_processor.AttnAddedKVProcessor

< source >

( )

用于执行注意力相关计算的处理器，带有用于文本编码器的额外可学习的键和值矩阵。

class diffusers.models.attention_processor.AttnAddedKVProcessor2_0

< source >

( )

用于执行缩放点积注意力（如果您正在使用 PyTorch 2.0，则默认启用）的处理器，带有用于文本编码器的额外可学习的键和值矩阵。

class diffusers.models.attention_processor.AttnProcessorNPU

< source >

( )

用于使用 torch_npu 实现 Flash Attention 的处理器。Torch_npu 仅支持 fp16 和 bf16 数据类型。如果使用 fp32，则将使用 F.scaled_dot_product_attention 进行计算，但在 NPU 上的加速效果不明显。

class diffusers.models.attention_processor.FusedAttnProcessor2_0

< source >

( )

用于实现缩放点积注意力（如果您正在使用 PyTorch 2.0，则默认启用）的处理器。它使用融合投影层。对于自注意力模块，所有投影矩阵（即，query、key、value）都被融合。对于交叉注意力模块，key 和 value 投影矩阵被融合。

此 API 目前本质上是 🧪 实验性的，未来可能会发生变化。

Allegro

class diffusers.models.attention_processor.AllegroAttnProcessor2_0

< source >

( )

用于实现缩放点积注意力（如果您正在使用 PyTorch 2.0，则默认启用）的处理器。这在 Allegro 模型中使用。它在 query 和 key 向量上应用归一化层和旋转嵌入。

AuraFlow

class diffusers.models.attention_processor.AuraFlowAttnProcessor2_0

< source >

( )

通常用于处理 Aura Flow 的注意力处理器。

class diffusers.models.attention_processor.FusedAuraFlowAttnProcessor2_0

< source >

( )

通常用于处理带有融合投影的 Aura Flow 的注意力处理器。

CogVideoX

class diffusers.models.attention_processor.CogVideoXAttnProcessor2_0

< source >

( )

用于为 CogVideoX 模型实现缩放点积注意力机制的处理器。它在查询和键向量上应用旋转嵌入，但不包含空间归一化。

class diffusers.models.attention_processor.FusedCogVideoXAttnProcessor2_0

< source >

( )

用于为 CogVideoX 模型实现缩放点积注意力机制的处理器。它在查询和键向量上应用旋转嵌入，但不包含空间归一化。

CrossFrameAttnProcessor

class diffusers.pipelines.text_to_video_synthesis.pipeline_text_to_video_zero.CrossFrameAttnProcessor

< source >

( batch_size = 2 )

参数

batch_size — 表示实际批大小的数字，帧数除外。例如，使用单个提示和 num_images_per_prompt=1 调用 unet 时，由于无分类器引导，batch_size 应等于 2。

跨帧注意力处理器。每个帧都关注第一帧。

Custom Diffusion

class diffusers.models.attention_processor.CustomDiffusionAttnProcessor

< source >

( train_kv: bool = True train_q_out: bool = True hidden_size: typing.Optional[int] = None cross_attention_dim: typing.Optional[int] = None out_bias: bool = True dropout: float = 0.0 )

参数

train_kv (bool, defaults to True) — 是否新训练与文本特征相对应的键和值矩阵。
train_q_out (bool, defaults to True) — 是否新训练与潜在图像特征相对应的查询矩阵。
hidden_size (int, optional, defaults to None) — 注意力层的隐藏层大小。
cross_attention_dim (int, optional, defaults to None) — encoder_hidden_states 中的通道数。
out_bias (bool, defaults to True) — 是否在 train_q_out 中包含偏置参数。
dropout (float, optional, defaults to 0.0) — 要使用的 dropout 概率。

用于为 Custom Diffusion 方法实现注意力的处理器。

class diffusers.models.attention_processor.CustomDiffusionAttnProcessor2_0

< source >

( train_kv: bool = True train_q_out: bool = True hidden_size: typing.Optional[int] = None cross_attention_dim: typing.Optional[int] = None out_bias: bool = True dropout: float = 0.0 )

参数

train_kv (bool, defaults to True) — 是否新训练与文本特征相对应的键和值矩阵。
train_q_out (bool, defaults to True) — 是否新训练与潜在图像特征相对应的查询矩阵。
hidden_size (int, optional, defaults to None) — 注意力层的隐藏层大小。
cross_attention_dim (int, optional, defaults to None) — encoder_hidden_states 中的通道数。
out_bias (bool, defaults to True) — 是否在 train_q_out 中包含偏置参数。
dropout (float, optional, defaults to 0.0) — 要使用的 dropout 概率。

用于使用 PyTorch 2.0 的内存高效缩放点积注意力为 Custom Diffusion 方法实现注意力的处理器。

class diffusers.models.attention_processor.CustomDiffusionXFormersAttnProcessor

< source >

( train_kv: bool = True train_q_out: bool = False hidden_size: typing.Optional[int] = None cross_attention_dim: typing.Optional[int] = None out_bias: bool = True dropout: float = 0.0 attention_op: typing.Optional[typing.Callable] = None )

参数

train_kv (bool, defaults to True) — 是否新训练与文本特征相对应的键和值矩阵。
train_q_out (bool, defaults to True) — 是否新训练与潜在图像特征相对应的查询矩阵。
hidden_size (int, optional, defaults to None) — 注意力层的隐藏层大小。
cross_attention_dim (int, optional, defaults to None) — encoder_hidden_states 中的通道数。
out_bias (bool, defaults to True) — 是否在 train_q_out 中包含偏置参数。
dropout (float, 可选, 默认为 0.0) — 要使用的 dropout 概率。
attention_op (Callable, 可选, 默认为 None) — 用作 attention 算子的基础 operator。建议设置为 None，并允许 xFormers 选择最佳算子。