FluxTransformer2DModel
来自 Flux 的用于图像类数据的 Transformer 模型。
FluxTransformer2DModel
class diffusers.FluxTransformer2DModel
< 源代码 >( patch_size: int = 1 in_channels: int = 64 num_layers: int = 19 num_single_layers: int = 38 attention_head_dim: int = 128 num_attention_heads: int = 24 joint_attention_dim: int = 4096 pooled_projection_dim: int = 768 guidance_embeds: bool = False axes_dims_rope: List = [16, 56, 56] )
参数
- patch_size (
int
) — 将输入数据转换为小块的块大小。 - in_channels (
int
, 可选, 默认值 16) — 输入通道的数量。 - num_layers (
int
, 可选, 默认值 18) — 要使用的 MMDiT 块层数。 - num_single_layers (
int
, 可选, 默认值 18) — 要使用的单个 DiT 块层数。 - attention_head_dim (
int
, 可选, 默认值 64) — 每个头部的通道数量。 - num_attention_heads (
int
, 可选, 默认值 18) — 用于多头注意力的头部数量。 - joint_attention_dim (
int
, 可选) — 要使用的encoder_hidden_states
维度数量。 - pooled_projection_dim (
int
) — 投影pooled_projections
时要使用的维度数量。 - guidance_embeds (
bool
, 默认值 False) — 是否使用引导嵌入。
Flux 中介绍的 Transformer 模型。
参考: https://blackforestlabs.ai/announcing-black-forest-labs/
The FluxTransformer2DModel 正向传播方法。