模型 - Hugging Face 机器学习平台

类 optimum.intel.openvino.modeling_base.OVBaseModel

( 模型: 模型配置: PretrainedConfig = 无设备: str = 'CPU' 动态形状: bool = True ov_配置: typing.Optional[typing.Dict[str, str]] = 无模型_保存_目录: typing.Union[str, pathlib.Path, optimum.intel.openvino.utils.TemporaryDirectory, NoneType] = 无量化_配置: typing.Union[optimum.intel.openvino.configuration.OVWeightQuantizationConfig, typing.Dict, NoneType] = 无 **kwargs )

基础 OVModel 类。

从预训练

< 来源 >

( 模型_id: typing.Union[str, pathlib.Path] 导出: bool = False 强制_下载: bool = False 使用_auth_token: typing.Union[bool, str, NoneType] = None token: typing.Union[bool, str, NoneType] = None 缓存_目录: str = '/root/.cache/huggingface/hub' 子文件夹: str = '' 配置: typing.Optional[transformers.configuration_utils.PretrainedConfig] = None 仅本地文件: bool = False 信任_远程_代码: bool = False 版本: typing.Optional[str] = None **kwargs )

参数

model_id (Union[str, Path]) — 可以是：
- 一个字符串，即托管在 huggingface.co 模型仓库中的预训练模型的模型 ID。有效的模型 ID 可以是根级别的，如 bert-base-uncased，也可以是用户或组织名称空间下的，如 dbmdz/bert-base-german-cased。
- 一个包含使用 ~OptimizedModel.save_pretrained 保存的模型目录的路径，例如 ./my_model_directory/。
export (bool, 默认为 False) — 定义提供的 model_id 是否需要导出为目标格式。
force_download (bool, 默认为 True) — 是否强制（重新）下载模型权重和配置文件，如果存在缓存版本则覆盖。
use_auth_token (Optional[Union[bool,str]], 默认为 None) — 已弃用。请改用 token 参数。
token (Optional[Union[bool,str]], 默认为 None) — 用作远程文件 HTTP bearer 授权的令牌。如果为 True，将使用运行 huggingface-cli login 时生成的令牌（存储在 huggingface_hub.constants.HF_TOKEN_PATH 中）。
cache_dir (Optional[str], 默认为 None) — 如果不应使用标准缓存，则为下载的预训练模型配置应缓存的目录路径。
subfolder (str, 默认为 "") — 如果相关文件位于模型仓库的子文件夹中（本地或 huggingface.co 上），您可以在此处指定文件夹名称。
config (Optional[transformers.PretrainedConfig], 默认为 None) — 模型配置。
local_files_only (Optional[bool], 默认为 False) — 是否只查看本地文件（即不尝试下载模型）。
trust_remote_code (bool, 默认为 False) — 是否允许 Hub 上定义的自定义代码进行建模。此选项仅应设置为 True，用于您信任且已阅读其代码的仓库，因为它将在您的本地机器上执行 Hub 上存在的代码。
revision (Optional[str], 默认为 None) — 要使用的特定模型版本。它可以是分支名称、标签名称或提交 ID，因为我们使用基于 git 的系统存储 huggingface.co 上的模型和其他工件，因此 revision 可以是 git 允许的任何标识符。

从预训练模型配置实例化预训练模型。

重塑

< 来源 >

( 批次大小: int 序列长度: int 高度: int = 无宽度: int = 无 )

参数

batch_size (int) — 批次大小。
sequence_length (int) — 序列长度或通道数。
height (int, 可选) — 图像高度。
width (int, 可选) — 图像宽度。

在模型的层上传播给定的输入形状，修复模型的输入形状。

类 optimum.intel.OVModelForCausalLM

< 来源 >

( 模型: 模型配置: PretrainedConfig = 无设备: str = 'CPU' 动态形状: bool = 无 ov_配置: typing.Optional[typing.Dict[str, str]] = 无模型_保存_目录: typing.Union[str, pathlib.Path, optimum.intel.openvino.utils.TemporaryDirectory, NoneType] = 无量化_配置: typing.Union[optimum.intel.openvino.configuration.OVWeightQuantizationConfig, typing.Dict, NoneType] = 无 **kwargs )

参数

model (openvino.Model) — 是用于运行 OpenVINO Runtime 推理的主要类。
config (transformers.PretrainedConfig) — PretrainedConfig 是模型配置类，包含模型的所有参数。用配置文件初始化不会加载与模型相关的权重，只加载配置。请查看 ~intel.openvino.modeling.OVBaseModel.from_pretrained 方法以加载模型权重。
device (str, 默认为 "CPU") — 模型将优化的设备类型。生成的编译模型将包含特定于此设备的节点。
dynamic_shapes (bool, 默认为 True) — 当设置为 True 时，模型的所有维度都将设置为动态。默认为 False 时，模型不会动态重塑。
ov_config (Optional[Dict], 默认为 None) — 包含与模型编译相关信息的字典。
compile (bool, 默认为 True) — 当设置为 False 时，在加载步骤中禁用模型编译。在模型需要静态重塑、设备修改或启用 FP16 转换的情况下，这可能有助于避免不必要的编译。

具有因果语言建模头（与输入嵌入绑定的线性层）的 OpenVINO 模型。

此模型继承自 optimum.intel.openvino.modeling.OVBaseModel。请查看超类文档，了解库为其所有模型实现的通用方法（例如下载或保存）

前进

< 来源 >

( 输入_ids: LongTensor 注意_mask: typing.Optional[torch.LongTensor] = 无过去_key_values: typing.Optional[typing.Tuple[typing.Tuple[torch.FloatTensor]]] = 无位置_ids: typing.Optional[torch.LongTensor] = 无 token_type_ids: typing.Optional[torch.LongTensor] = 无 **kwargs )

生成

< 来源 >

( inputs: typing.Optional[torch.Tensor] = 无生成_配置: typing.Optional[transformers.generation.configuration_utils.GenerationConfig] = 无 logits_处理器: typing.Optional[transformers.generation.logits_process.LogitsProcessorList] = 无停止_条件: typing.Optional[transformers.generation.stopping_criteria.StoppingCriteriaList] = 无前缀_允许_tokens_fn: typing.Optional[typing.Callable[[int, torch.Tensor], typing.List[int]]] = 无同步_gpus: typing.Optional[bool] = 无助手_模型: typing.Optional[ForwardRef('PreTrainedModel')] = 无流式传输器: typing.Optional[ForwardRef('BaseStreamer')] = 无负数_提示_ids: typing.Optional[torch.Tensor] = 无负数_提示_attention_mask: typing.Optional[torch.Tensor] = 无 **kwargs )

类 optimum.intel.OVModelForMaskedLM

< 来源 >

( 模型 = 无配置 = 无 **kwargs )

参数

model (openvino.Model) — 是用于运行 OpenVINO Runtime 推理的主要类。
config (transformers.PretrainedConfig) — PretrainedConfig 是模型配置类，包含模型的所有参数。用配置文件初始化不会加载与模型相关的权重，只加载配置。请查看 ~intel.openvino.modeling.OVBaseModel.from_pretrained 方法以加载模型权重。
device (str, 默认为 "CPU") — 模型将优化的设备类型。生成的编译模型将包含特定于此设备的节点。
dynamic_shapes (bool, 默认为 True) — 当设置为 True 时，模型的所有维度都将设置为动态。默认为 False 时，模型不会动态重塑。
ov_config (Optional[Dict], 默认为 None) — 包含与模型编译相关信息的字典。
compile (bool, 默认为 True) — 当设置为 False 时，在加载步骤中禁用模型编译。在模型需要静态重塑、设备修改或启用 FP16 转换的情况下，这可能有助于避免不必要的编译。

OpenVINO 模型，带有 MaskedLMOutput，用于掩码语言建模任务。

此模型继承自 optimum.intel.openvino.modeling.OVBaseModel。请查看超类文档，了解库为其所有模型实现的通用方法（例如下载或保存）

前进

< 来源 >

( 输入_ids: typing.Union[torch.Tensor, numpy.ndarray] 注意_mask: typing.Union[torch.Tensor, numpy.ndarray] token_type_ids: typing.Union[torch.Tensor, numpy.ndarray, NoneType] = 无 **kwargs )

参数

input_ids (torch.Tensor) — 词汇表中输入序列标记的索引。可以使用 AutoTokenizer 获取索引。什么是输入 ID？
attention_mask (torch.Tensor), 可选) — 用于避免对填充标记索引执行注意力操作的掩码。掩码值选择范围为 [0, 1]：
- 1 表示未掩码的标记，
- 0 表示已掩码的标记。什么是注意力掩码？
token_type_ids (torch.Tensor, 可选) — 分段标记索引，指示输入的第一个和第二个部分。索引选择范围为 [0, 1]：
- 1 表示句子 A 中的标记，
- 0 表示句子 B 中的标记。什么是标记类型 ID？

OVModelForMaskedLM 的前向方法，覆盖了 __call__ 特殊方法。

虽然前向传播的配方需要在此函数中定义，但在此之后应调用 Module 实例，而不是此函数，因为前者负责运行预处理和后处理步骤，而后者则默默地忽略它们。

使用 transformers.pipelines 进行掩码语言建模的示例

>>> from transformers import AutoTokenizer, pipeline
>>> from optimum.intel import OVModelForMaskedLM

>>> tokenizer = AutoTokenizer.from_pretrained("roberta-base")
>>> model = OVModelForMaskedLM.from_pretrained("roberta-base", export=True)
>>> mask_token = tokenizer.mask_token
>>> pipe = pipeline("fill-mask", model=model, tokenizer=tokenizer)
>>> outputs = pipe("The goal of life is" + mask_token)

类 optimum.intel.OVModelForSeq2SeqLM

< 来源 >

( 编码器: 模型解码器: 模型解码器_with_past: 模型 = 无配置: PretrainedConfig = 无设备: str = 'CPU' 动态形状: bool = True ov_配置: typing.Optional[typing.Dict[str, str]] = 无模型_保存_目录: typing.Union[str, pathlib.Path, optimum.intel.openvino.utils.TemporaryDirectory, NoneType] = 无量化_配置: typing.Union[optimum.intel.openvino.configuration.OVWeightQuantizationConfig, typing.Dict] = 无 **kwargs )

参数

encoder (openvino.Model) — 与编码器关联的 OpenVINO Runtime 模型。
解码器 (openvino.Model) — 与解码器关联的 OpenVINO Runtime 模型。
带过去值的解码器 (openvino.Model) — 与带过去键值的解码器关联的 OpenVINO Runtime 模型。
配置 (transformers.PretrainedConfig) — PretrainedConfig 是与模型关联的配置实例。用配置文件初始化不会加载与模型关联的权重，只加载配置。

用于 OpenVINO 推理的带语言建模头的序列到序列模型。

前进

< 来源 >

( input_ids: LongTensor = None attention_mask: typing.Optional[torch.FloatTensor] = None decoder_input_ids: typing.Optional[torch.LongTensor] = None decoder_attention_mask: typing.Optional[torch.LongTensor] = None encoder_outputs: typing.Optional[typing.Tuple[typing.Tuple[torch.Tensor]]] = None past_key_values: typing.Optional[typing.Tuple[typing.Tuple[torch.Tensor]]] = None cache_position: typing.Optional[torch.LongTensor] = None labels: typing.Optional[torch.LongTensor] = None **kwargs )

参数

输入 ID (torch.LongTensor) — 词汇表中输入序列标记的索引，形状为 (batch_size, encoder_sequence_length)。
注意力掩码 (torch.LongTensor) — 用于避免对填充标记索引执行注意力的掩码，形状为 (batch_size, encoder_sequence_length)。掩码值选择在 [0, 1]。
解码器输入 ID (torch.LongTensor) — 词汇表中解码器输入序列标记的索引，形状为 (batch_size, decoder_sequence_length)。
编码器输出 (torch.FloatTensor) — 编码器 last_hidden_state 的形状为 (batch_size, encoder_sequence_length, hidden_size)。
过去键值 (tuple(tuple(torch.FloatTensor), *可选*) — 包含用于加速解码的注意力块的预计算键和值隐藏状态。元组的长度为 config.n_layers，每个元组包含两个形状为 (batch_size, num_heads, decoder_sequence_length, embed_size_per_head) 的张量和两个形状为 (batch_size, num_heads, encoder_sequence_length, embed_size_per_head) 的额外张量。

OVModelForSeq2SeqLM 的 forward 方法，覆盖了 __call__ 特殊方法。

虽然前向传播的配方需要在此函数中定义，但在此之后应调用 Module 实例，而不是此函数，因为前者负责运行预处理和后处理步骤，而后者则默默地忽略它们。

文本生成示例

>>> from transformers import AutoTokenizer
>>> from optimum.intel import OVModelForSeq2SeqLM

>>> tokenizer = AutoTokenizer.from_pretrained("echarlaix/t5-small-openvino")
>>> model = OVModelForSeq2SeqLM.from_pretrained("echarlaix/t5-small-openvino")
>>> text = "He never went out without a book under his arm, and he often came back with two."
>>> inputs = tokenizer(text, return_tensors="pt")
>>> gen_tokens = model.generate(**inputs)
>>> outputs = tokenizer.batch_decode(gen_tokens)

使用 transformers.pipeline 的示例

>>> from transformers import AutoTokenizer, pipeline
>>> from optimum.intel import OVModelForSeq2SeqLM

>>> tokenizer = AutoTokenizer.from_pretrained("echarlaix/t5-small-openvino")
>>> model = OVModelForSeq2SeqLM.from_pretrained("echarlaix/t5-small-openvino")
>>> pipe = pipeline("translation_en_to_fr", model=model, tokenizer=tokenizer)
>>> text = "He never went out without a book under his arm, and he often came back with two."
>>> outputs = pipe(text)

class optimum.intel.OVModelForQuestionAnswering

< 来源 >

( 模型 = 无配置 = 无 **kwargs )

参数

模型 (openvino.Model) — 是用于运行 OpenVINO Runtime 推理的主要类。
配置 (transformers.PretrainedConfig) — PretrainedConfig 是模型配置类，包含模型的所有参数。用配置文件初始化不会加载与模型关联的权重，只加载配置。请查看 ~intel.openvino.modeling.OVBaseModel.from_pretrained 方法以加载模型权重。
设备 (str, 默认为 "CPU") — 模型将为其优化的设备类型。生成的编译模型将包含特定于此设备的节点。
动态形状 (bool, 默认为 True) — 当设置为 True 时，模型的所有维度都将设置为动态。默认情况下，如果模型不需要动态重塑，则应设置为 False。
OpenVINO 配置 (Optional[Dict], 默认为 None) — 包含模型编译相关信息的字典。
编译 (bool, 默认为 True) — 当设置为 False 时，在加载步骤中禁用模型编译。在模型需要静态重塑、设备修改或启用 FP16 转换的情况下，这对于避免不必要的编译很有用。

带 QuestionAnsweringModelOutput 的 OpenVINO 模型，用于抽取式问答任务。

此模型继承自 optimum.intel.openvino.modeling.OVBaseModel。请查看超类文档，了解库为其所有模型实现的通用方法（例如下载或保存）

前进

< 来源 >

( 输入_ids: typing.Union[torch.Tensor, numpy.ndarray] 注意_mask: typing.Union[torch.Tensor, numpy.ndarray] token_type_ids: typing.Union[torch.Tensor, numpy.ndarray, NoneType] = 无 **kwargs )

参数

输入 ID (torch.Tensor) — 词汇表中输入序列标记的索引。可以使用 AutoTokenizer 获取索引。什么是输入 ID？
注意力掩码 (torch.Tensor, 可选) — 用于避免对填充标记索引执行注意力的掩码。掩码值选择在 [0, 1]：
- 1 表示未被掩盖的标记，
- 0 表示被掩盖的标记。什么是注意力掩码？
标记类型 ID (torch.Tensor, 可选) — 分段标记索引，用于指示输入的第一个和第二个部分。索引选择在 [0, 1]：
- 1 表示句子 A 的标记，
- 0 表示句子 B 的标记。什么是标记类型 ID？

OVModelForQuestionAnswering 的 forward 方法，覆盖了 __call__ 特殊方法。

虽然前向传播的配方需要在此函数中定义，但在此之后应调用 Module 实例，而不是此函数，因为前者负责运行预处理和后处理步骤，而后者则默默地忽略它们。

使用 transformers.pipeline 进行问答的示例

>>> from transformers import AutoTokenizer, pipeline
>>> from optimum.intel import OVModelForQuestionAnswering

>>> tokenizer = AutoTokenizer.from_pretrained("distilbert-base-cased-distilled-squad")
>>> model = OVModelForQuestionAnswering.from_pretrained("distilbert-base-cased-distilled-squad", export=True)
>>> pipe = pipeline("question-answering", model=model, tokenizer=tokenizer)
>>> question, text = "Who was Jim Henson?", "Jim Henson was a nice puppet"
>>> outputs = pipe(question, text)

class optimum.intel.OVModelForSequenceClassification

< 来源 >

( 模型 = 无配置 = 无 **kwargs )

参数

模型 (openvino.Model) — 是用于运行 OpenVINO Runtime 推理的主要类。
配置 (transformers.PretrainedConfig) — PretrainedConfig 是模型配置类，包含模型的所有参数。用配置文件初始化不会加载与模型关联的权重，只加载配置。请查看 ~intel.openvino.modeling.OVBaseModel.from_pretrained 方法以加载模型权重。
设备 (str, 默认为 "CPU") — 模型将为其优化的设备类型。生成的编译模型将包含特定于此设备的节点。
动态形状 (bool, 默认为 True) — 当设置为 True 时，模型的所有维度都将设置为动态。默认情况下，如果模型不需要动态重塑，则应设置为 False。
OpenVINO 配置 (Optional[Dict], 默认为 None) — 包含模型编译相关信息的字典。
编译 (bool, 默认为 True) — 当设置为 False 时，在加载步骤中禁用模型编译。在模型需要静态重塑、设备修改或启用 FP16 转换的情况下，这对于避免不必要的编译很有用。

带 SequenceClassifierOutput 的 OpenVINO 模型，用于序列分类任务。

此模型继承自 optimum.intel.openvino.modeling.OVBaseModel。请查看超类文档，了解库为其所有模型实现的通用方法（例如下载或保存）

前进

< 来源 >

( 输入_ids: typing.Union[torch.Tensor, numpy.ndarray] 注意_mask: typing.Union[torch.Tensor, numpy.ndarray] token_type_ids: typing.Union[torch.Tensor, numpy.ndarray, NoneType] = 无 **kwargs )

参数

输入 ID (torch.Tensor) — 词汇表中输入序列标记的索引。可以使用 AutoTokenizer 获取索引。什么是输入 ID？
注意力掩码 (torch.Tensor, 可选) — 用于避免对填充标记索引执行注意力的掩码。掩码值选择在 [0, 1]：
- 1 表示未被掩盖的标记，
- 0 表示被掩盖的标记。什么是注意力掩码？
标记类型 ID (torch.Tensor, 可选) — 分段标记索引，用于指示输入的第一个和第二个部分。索引选择在 [0, 1]：
- 1 表示句子 A 的标记，
- 0 表示句子 B 的标记。什么是标记类型 ID？

OVModelForSequenceClassification 的 forward 方法，覆盖了 __call__ 特殊方法。

虽然前向传播的配方需要在此函数中定义，但在此之后应调用 Module 实例，而不是此函数，因为前者负责运行预处理和后处理步骤，而后者则默默地忽略它们。

使用 transformers.pipeline 进行序列分类的示例

>>> from transformers import AutoTokenizer, pipeline
>>> from optimum.intel import OVModelForSequenceClassification

>>> tokenizer = AutoTokenizer.from_pretrained("distilbert-base-uncased-finetuned-sst-2-english")
>>> model = OVModelForSequenceClassification.from_pretrained("distilbert-base-uncased-finetuned-sst-2-english", export=True)
>>> pipe = pipeline("text-classification", model=model, tokenizer=tokenizer)
>>> outputs = pipe("Hello, my dog is cute")

class optimum.intel.OVModelForTokenClassification

< 来源 >

( 模型 = 无配置 = 无 **kwargs )

参数

模型 (openvino.Model) — 是用于运行 OpenVINO Runtime 推理的主要类。
配置 (transformers.PretrainedConfig) — PretrainedConfig 是模型配置类，包含模型的所有参数。用配置文件初始化不会加载与模型关联的权重，只加载配置。请查看 ~intel.openvino.modeling.OVBaseModel.from_pretrained 方法以加载模型权重。
设备 (str, 默认为 "CPU") — 模型将为其优化的设备类型。生成的编译模型将包含特定于此设备的节点。
动态形状 (bool, 默认为 True) — 当设置为 True 时，模型的所有维度都将设置为动态。默认情况下，如果模型不需要动态重塑，则应设置为 False。
OpenVINO 配置 (Optional[Dict], 默认为 None) — 包含模型编译相关信息的字典。
编译 (bool, 默认为 True) — 当设置为 False 时，在加载步骤中禁用模型编译。在模型需要静态重塑、设备修改或启用 FP16 转换的情况下，这对于避免不必要的编译很有用。

带 TokenClassifierOutput 的 OpenVINO 模型，用于标记分类任务。

此模型继承自 optimum.intel.openvino.modeling.OVBaseModel。请查看超类文档，了解库为其所有模型实现的通用方法（例如下载或保存）

前进

< 来源 >

( 输入_ids: typing.Union[torch.Tensor, numpy.ndarray] 注意_mask: typing.Union[torch.Tensor, numpy.ndarray] token_type_ids: typing.Union[torch.Tensor, numpy.ndarray, NoneType] = 无 **kwargs )

参数

输入 ID (torch.Tensor) — 词汇表中输入序列标记的索引。可以使用 AutoTokenizer 获取索引。什么是输入 ID？
注意力掩码 (torch.Tensor, 可选) — 用于避免对填充标记索引执行注意力的掩码。掩码值选择在 [0, 1]：
- 1 表示未被掩盖的标记，
- 0 表示被掩盖的标记。什么是注意力掩码？
标记类型 ID (torch.Tensor, 可选) — 分段标记索引，用于指示输入的第一个和第二个部分。索引选择在 [0, 1]：
- 1 表示句子 A 的标记，
- 0 表示句子 B 的标记。什么是标记类型 ID？

OVModelForTokenClassification 的 forward 方法，覆盖了 __call__ 特殊方法。

虽然前向传播的配方需要在此函数中定义，但在此之后应调用 Module 实例，而不是此函数，因为前者负责运行预处理和后处理步骤，而后者则默默地忽略它们。

使用 transformers.pipelines 进行标记分类的示例

>>> from transformers import AutoTokenizer, pipeline
>>> from optimum.intel import OVModelForTokenClassification

>>> tokenizer = AutoTokenizer.from_pretrained("dslim/bert-base-NER")
>>> model = OVModelForTokenClassification.from_pretrained("dslim/bert-base-NER", export=True)
>>> pipe = pipeline("token-classification", model=model, tokenizer=tokenizer)
>>> outputs = pipe("My Name is Peter and I live in New York.")

class optimum.intel.OVModelForAudioClassification

< 来源 >

( 模型 = 无配置 = 无 **kwargs )

参数

模型 (openvino.Model) — 是用于运行 OpenVINO Runtime 推理的主要类。
配置 (transformers.PretrainedConfig) — PretrainedConfig 是模型配置类，包含模型的所有参数。用配置文件初始化不会加载与模型关联的权重，只加载配置。请查看 ~intel.openvino.modeling.OVBaseModel.from_pretrained 方法以加载模型权重。
设备 (str, 默认为 "CPU") — 模型将为其优化的设备类型。生成的编译模型将包含特定于此设备的节点。
动态形状 (bool, 默认为 True) — 当设置为 True 时，模型的所有维度都将设置为动态。默认情况下，如果模型不需要动态重塑，则应设置为 False。
OpenVINO 配置 (Optional[Dict], 默认为 None) — 包含模型编译相关信息的字典。
编译 (bool, 默认为 True) — 当设置为 False 时，在加载步骤中禁用模型编译。在模型需要静态重塑、设备修改或启用 FP16 转换的情况下，这对于避免不必要的编译很有用。

带 SequenceClassifierOutput 的 OpenVINO 模型，用于音频分类任务。

此模型继承自 optimum.intel.openvino.modeling.OVBaseModel。请查看超类文档，了解库为其所有模型实现的通用方法（例如下载或保存）

前进

< 来源 >

( input_values: typing.Union[torch.Tensor, numpy.ndarray] attention_mask: typing.Union[torch.Tensor, numpy.ndarray, NoneType] = None **kwargs )

参数

输入 ID (torch.Tensor) — 词汇表中输入序列标记的索引。可以使用 AutoTokenizer 获取索引。什么是输入 ID？
注意力掩码 (torch.Tensor, 可选) — 用于避免对填充标记索引执行注意力的掩码。掩码值选择在 [0, 1]：
- 1 表示未被掩盖的标记，
- 0 表示被掩盖的标记。什么是注意力掩码？
标记类型 ID (torch.Tensor, 可选) — 分段标记索引，用于指示输入的第一个和第二个部分。索引选择在 [0, 1]：
- 1 表示句子 A 的标记，
- 0 表示句子 B 的标记。什么是标记类型 ID？

OVModelForAudioClassification 的 forward 方法，覆盖了 __call__ 特殊方法。

虽然前向传播的配方需要在此函数中定义，但在此之后应调用 Module 实例，而不是此函数，因为前者负责运行预处理和后处理步骤，而后者则默默地忽略它们。

使用 transformers.pipelines 进行音频分类的示例

>>> from datasets import load_dataset
>>> from transformers import AutoFeatureExtractor, pipeline
>>> from optimum.intel import OVModelForAudioClassification

>>> preprocessor = AutoFeatureExtractor.from_pretrained("superb/hubert-base-superb-er")
>>> model = OVModelForAudioClassification.from_pretrained("superb/hubert-base-superb-er", export=True)
>>> pipe = pipeline("audio-classification", model=model, feature_extractor=preprocessor)
>>> dataset = load_dataset("superb", "ks", split="test")
>>> audio_file = dataset[3]["audio"]["array"]
>>> outputs = pipe(audio_file)

最佳

模型

通用模型类

类 optimum.intel.openvino.modeling_base.OVBaseModel

从预训练

重塑

自然语言处理

OVModelForCausalLM

类 optimum.intel.OVModelForCausalLM

前进

生成

OVModelForMaskedLM

类 optimum.intel.OVModelForMaskedLM

前进

OVModelForSeq2SeqLM

类 optimum.intel.OVModelForSeq2SeqLM

前进

OVModelForQuestionAnswering

class optimum.intel.OVModelForQuestionAnswering

前进

OVModelForSequenceClassification

class optimum.intel.OVModelForSequenceClassification

前进

OVModelForTokenClassification

class optimum.intel.OVModelForTokenClassification

前进

音频

OVModelForAudioClassification

class optimum.intel.OVModelForAudioClassification

前进

OVModelForAudioFrameClassification

class optimum.intel.OVModelForAudioFrameClassification

前进

OVModelForCTC

class optimum.intel.OVModelForCTC

前进

OVModelForAudioXVector

class optimum.intel.OVModelForAudioXVector

前进

OVModelForSpeechSeq2Seq

class optimum.intel.OVModelForSpeechSeq2Seq

前进

计算机视觉

OVModelForImageClassification

class optimum.intel.OVModelForImageClassification

前进

多模态

OVModelForVision2Seq

class optimum.intel.OVModelForVision2Seq

前进

OVModelForPix2Struct

class optimum.intel.OVModelForPix2Struct

前进

自定义任务

OVModelForCustomTasks

class optimum.intel.OVModelForCustomTasks

前进

OVModelForFeatureExtraction

class optimum.intel.OVModelForFeatureExtraction

前进

文本到图像

OVStableDiffusionPipeline

class optimum.intel.OVStableDiffusionPipeline

前进

OVStableDiffusionXLPipeline

class optimum.intel.OVStableDiffusionXLPipeline

前进

OVLatentConsistencyModelPipeline

class optimum.intel.OVLatentConsistencyModelPipeline

前进

图像到图像

OVStableDiffusionImg2ImgPipeline

class optimum.intel.OVStableDiffusionImg2ImgPipeline

前进

OVStableDiffusionXLImg2ImgPipeline

class optimum.intel.OVStableDiffusionXLImg2ImgPipeline

前进

Inpainting

OVStableDiffusionInpaintPipeline

class optimum.intel.OVStableDiffusionInpaintPipeline