Hub Python 库文档

实用工具

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

实用工具

配置日志记录

huggingface_hub 包公开了一个 logging 实用工具来控制包本身的日志记录级别。您可以像这样导入它

from huggingface_hub import logging

然后,您可以定义详细程度以更新您将看到的日志量

from huggingface_hub import logging

logging.set_verbosity_error()
logging.set_verbosity_warning()
logging.set_verbosity_info()
logging.set_verbosity_debug()

logging.set_verbosity(...)

级别应理解如下

  • error:仅显示有关可能导致错误或意外行为的使用情况的关键日志。
  • warning:显示非关键日志,但使用可能会导致意外行为。此外,可能会显示重要的信息性日志。
  • info:显示大多数日志,包括一些关于幕后情况的详细日志。如果某些行为异常,我们建议将详细级别切换到此级别以获取更多信息。
  • debug:显示所有日志,包括一些可用于准确跟踪幕后情况的内部日志。

huggingface_hub.utils.logging.get_verbosity

< >

( )

返回 HuggingFace Hub 根记录器的当前级别。

HuggingFace Hub 具有以下日志记录级别

  • huggingface_hub.logging.CRITICALhuggingface_hub.logging.FATAL
  • huggingface_hub.logging.ERROR
  • huggingface_hub.logging.WARNINGhuggingface_hub.logging.WARN
  • huggingface_hub.logging.INFO
  • huggingface_hub.logging.DEBUG

huggingface_hub.utils.logging.set_verbosity

< >

( verbosity: int )

参数

  • verbosity (int) — 日志记录级别,例如 huggingface_hub.logging.DEBUGhuggingface_hub.logging.INFO

设置 HuggingFace Hub 根记录器的级别。

huggingface_hub.utils.logging.set_verbosity_info

< >

( )

将详细程度设置为 logging.INFO

huggingface_hub.utils.logging.set_verbosity_debug

< >

( )

将详细级别设置为 logging.DEBUG

huggingface_hub.utils.logging.set_verbosity_warning

< >

( )

将详细级别设置为 logging.WARNING

huggingface_hub.utils.logging.set_verbosity_error

< >

( )

将详细级别设置为 logging.ERROR

huggingface_hub.utils.logging.disable_propagation

< >

( )

禁用库日志输出的传播。请注意,默认情况下禁用日志传播。

huggingface_hub.utils.logging.enable_propagation

< >

( )

启用库日志输出的传播。如果已配置根记录器,请禁用 HuggingFace Hub 的默认处理程序以防止重复记录。

特定于仓库的辅助方法

以下公开的方法与修改 huggingface_hub 库本身的模块相关。如果您使用 huggingface_hub 并且不修改它们,则无需使用这些方法。

huggingface_hub.utils.logging.get_logger

< >

( name: Optional = None )

参数

  • name (str, 可选) — 要获取的记录器的名称,通常是文件名

返回具有指定名称的记录器。此函数不应由库用户直接访问。

示例

>>> from huggingface_hub import get_logger

>>> logger = get_logger(__file__)
>>> logger.set_verbosity_info()

配置进度条

进度条是在执行长时间运行的任务(例如下载或上传文件)时向用户显示信息的实用工具。huggingface_hub 公开了一个 tqdm 包装器,以便在整个库中以一致的方式显示进度条。

默认情况下,进度条是启用的。您可以通过设置 HF_HUB_DISABLE_PROGRESS_BARS 环境变量全局禁用它们。您还可以使用 enable_progress_bars()disable_progress_bars() 启用/禁用它们。如果设置了环境变量,则它优先于助手。

>>> from huggingface_hub import snapshot_download
>>> from huggingface_hub.utils import are_progress_bars_disabled, disable_progress_bars, enable_progress_bars

>>> # Disable progress bars globally
>>> disable_progress_bars()

>>> # Progress bar will not be shown !
>>> snapshot_download("gpt2")

>>> are_progress_bars_disabled()
True

>>> # Re-enable progress bars globally
>>> enable_progress_bars()

特定组的进度条控制

您还可以为特定组启用或禁用进度条。这允许您在应用程序或库的不同部分中更精细地管理进度条的可见性。当某个组的进度条被禁用时,它下面的所有子组也会受到影响,除非明确覆盖。

# Disable progress bars for a specific group
>>> disable_progress_bars("peft.foo")
>>> assert not are_progress_bars_disabled("peft")
>>> assert not are_progress_bars_disabled("peft.something")
>>> assert are_progress_bars_disabled("peft.foo")
>>> assert are_progress_bars_disabled("peft.foo.bar")

# Re-enable progress bars for a subgroup
>>> enable_progress_bars("peft.foo.bar")
>>> assert are_progress_bars_disabled("peft.foo")
>>> assert not are_progress_bars_disabled("peft.foo.bar")

# Use groups with tqdm
# No progress bar for `name="peft.foo"`
>>> for _ in tqdm(range(5), name="peft.foo"):
...     pass

# Progress bar will be shown for `name="peft.foo.bar"`
>>> for _ in tqdm(range(5), name="peft.foo.bar"):
...     pass
100%|███████████████████████████████████████| 5/5 [00:00<00:00, 117817.53it/s]

are_progress_bars_disabled

huggingface_hub.utils.are_progress_bars_disabled

< >

( name: Optional = None ) bool

参数

  • name (str, 可选) — 要检查的组名;如果为 None,则检查全局设置。

返回

bool

如果进度条被禁用,则为 True,否则为 False。

检查进度条是否全局禁用或针对特定组禁用。

此函数返回进度条是否针对给定组或全局禁用。它首先检查 HF_HUB_DISABLE_PROGRESS_BARS 环境变量,然后检查程序设置。

禁用进度条

huggingface_hub.utils.disable_progress_bars

< >

( name: Optional = None )

参数

  • name (str, 可选) — 要禁用进度条的组的名称。如果为 None,则全局禁用进度条。

引发

警告

  • 警告 — 如果环境变量阻止更改。

全局或针对指定组禁用进度条。

此函数根据组名更新进度条的状态。如果未提供组名,则禁用所有进度条。该操作遵循 HF_HUB_DISABLE_PROGRESS_BARS 环境变量的设置。

启用进度条

huggingface_hub.utils.enable_progress_bars

< >

( name: Optional = None )

参数

  • name (str, 可选) — 要启用进度条的组的名称。如果为 None,则全局启用进度条。

引发

警告

  • 警告 — 如果环境变量阻止更改。

全局或针对指定组启用进度条。

此函数将指定组的进度条设置为启用状态,如果未指定组,则全局启用。该操作受 HF_HUB_DISABLE_PROGRESS_BARS 环境设置的约束。

配置 HTTP 后端

在某些环境中,您可能需要配置 HTTP 调用的方式,例如,如果您正在使用代理。huggingface_hub 允许您使用 configure_http_backend() 全局配置此项。然后,所有向 Hub 发出的请求都将使用您的设置。在底层,huggingface_hub 使用 requests.Session,因此您可能需要参考 requests 文档 以了解更多可用参数。

由于 requests.Session 不保证是线程安全的,因此 huggingface_hub 会为每个线程创建一个会话实例。使用会话允许我们在 HTTP 调用之间保持连接打开,并最终节省时间。如果您将 huggingface_hub 集成到第三方库中,并希望对 Hub 进行自定义调用,请使用 get_session() 获取由用户配置的会话(即用 get_session().get(...) 替换任何 requests.get(...) 调用)。

huggingface_hub.configure_http_backend

< >

( backend_factory: Callable = <function _default_backend_factory at 0x7fbffe54aef0> )

通过提供 backend_factory 配置 HTTP 后端。 huggingface_hub 发出的任何 HTTP 调用都将使用此工厂实例化的会话对象。如果您在需要自定义配置(例如自定义代理或证书)的特定环境中运行脚本,这将非常有用。

使用 get_session() 获取已配置的会话。由于 requests.Session 不保证是线程安全的,因此 huggingface_hub 会为每个线程创建一个会话实例。它们都是使用在 configure_http_backend() 中设置的相同 backend_factory 实例化的。LRU 缓存用于在调用之间缓存创建的会话(和连接)。最大大小为 128,以避免在生成数千个线程时发生内存泄漏。

请参阅 此问题 以详细了解 requests 中的线程安全。

示例

import requests
from huggingface_hub import configure_http_backend, get_session

# Create a factory function that returns a Session with configured proxies
def backend_factory() -> requests.Session:
    session = requests.Session()
    session.proxies = {"http": "http://10.10.1.10:3128", "https": "https://10.10.1.11:1080"}
    return session

# Set it as the default session factory
configure_http_backend(backend_factory=backend_factory)

# In practice, this is mostly done internally in `huggingface_hub`
session = get_session()

huggingface_hub.get_session

< >

( )

使用用户的会话工厂获取 requests.Session 对象。

使用 get_session() 获取已配置的会话。由于 requests.Session 不保证是线程安全的,因此 huggingface_hub 会为每个线程创建一个会话实例。它们都是使用在 configure_http_backend() 中设置的相同 backend_factory 实例化的。LRU 缓存用于在调用之间缓存创建的会话(和连接)。最大大小为 128,以避免在生成数千个线程时发生内存泄漏。

请参阅 此问题 以详细了解 requests 中的线程安全。

示例

import requests
from huggingface_hub import configure_http_backend, get_session

# Create a factory function that returns a Session with configured proxies
def backend_factory() -> requests.Session:
    session = requests.Session()
    session.proxies = {"http": "http://10.10.1.10:3128", "https": "https://10.10.1.11:1080"}
    return session

# Set it as the default session factory
configure_http_backend(backend_factory=backend_factory)

# In practice, this is mostly done internally in `huggingface_hub`
session = get_session()

处理 HTTP 错误

huggingface_hub 定义了自己的 HTTP 错误,以使用服务器发送回的附加信息来优化 requests 引发的 HTTPError

引发状态异常

hf_raise_for_status() 旨在成为从对 Hub 发出的任何请求中“引发状态异常”的中心方法。它包装了基本的 requests.raise_for_status 以提供其他信息。抛出的任何 HTTPError 都会转换为 HfHubHTTPError

import requests
from huggingface_hub.utils import hf_raise_for_status, HfHubHTTPError

response = requests.post(...)
try:
    hf_raise_for_status(response)
except HfHubHTTPError as e:
    print(str(e)) # formatted message
    e.request_id, e.server_message # details returned by server

    # Complete the error message with additional information once it's raised
    e.append_to_message("\n`create_commit` expects the repository to exist.")
    raise

huggingface_hub.utils.hf_raise_for_status

< >

( response: Response endpoint_name: Optional = None )

参数

  • response (Response) — 来自服务器的响应。
  • endpoint_name (str, 可选) — 已被调用的端点的名称。如果提供,错误信息将更完整。

response.raise_for_status() 的内部版本,它将细化潜在的 HTTPError。引发的异常将是 HfHubHTTPError 的实例。

此帮助程序旨在成为在调用 Hugging Face Hub 时 raise_for_status 的唯一方法。

示例

    import requests
    from huggingface_hub.utils import get_session, hf_raise_for_status, HfHubHTTPError

    response = get_session().post(...)
    try:
        hf_raise_for_status(response)
    except HfHubHTTPError as e:
        print(str(e)) # formatted message
        e.request_id, e.server_message # details returned by server

        # Complete the error message with additional information once it's raised
        e.append_to_message("
ate_commit` expects the repository to exist.")
        raise

当请求失败时引发

  • RepositoryNotFoundError 如果找不到要下载的仓库。这可能是因为它不存在,因为 repo_type 设置不正确,或者因为仓库是 private 并且您没有访问权限。
  • GatedRepoError 如果仓库存在但受到门控,并且用户不在授权列表中。
  • RevisionNotFoundError 如果仓库存在但找不到修订版本。
  • EntryNotFoundError 如果仓库存在但找不到条目(例如请求的文件)。
  • BadRequestError 如果请求因 HTTP 400 BadRequest 错误而失败。
  • HfHubHTTPError 如果请求因上述未列出的原因而失败。

HTTP 错误

以下是 huggingface_hub 中抛出的 HTTP 错误列表。

HfHubHTTPError

HfHubHTTPError 是 HF Hub 中引发的任何自定义 HTTP 错误的父类。它负责解析服务器响应并格式化错误消息,以便为用户提供尽可能多的信息。

huggingface_hub.errors.HfHubHTTPError

< >

( message: str response: Optional = None server_message: Optional = None )

要继承的 HTTPError,用于在 HF Hub 中引发的任何自定义 HTTP 错误。

任何 HTTPError 至少都会转换为 HfHubHTTPError。如果服务器发回了一些信息,它将被添加到错误消息中。

添加的详细信息

  • 如果存在,则来自“X-Request-Id”标头的请求 ID。如果不存在,则回退到“X-Amzn-Trace-Id”标头(如果存在)。
  • 来自标头“X-Error-Message”的服务器错误消息。
  • 如果我们可以在响应正文中找到服务器错误消息。

示例

    import requests
    from huggingface_hub.utils import get_session, hf_raise_for_status, HfHubHTTPError

    response = get_session().post(...)
    try:
        hf_raise_for_status(response)
    except HfHubHTTPError as e:
        print(str(e)) # formatted message
        e.request_id, e.server_message # details returned by server

        # Complete the error message with additional information once it's raised
        e.append_to_message("
ate_commit` expects the repository to exist.")
        raise

append_to_message

< >

( additional_message: str )

将附加信息附加到 HfHubHTTPError 的初始消息中。

RepositoryNotFoundError(找不到仓库错误)

huggingface_hub.errors.RepositoryNotFoundError

< >

( message: str response: Optional = None server_message: Optional = None )

当尝试访问具有无效仓库名称的 hf.co URL,或者访问用户没有权限的私有仓库名称时,会引发此错误。

示例

>>> from huggingface_hub import model_info
>>> model_info("<non_existent_repository>")
(...)
huggingface_hub.utils._errors.RepositoryNotFoundError: 401 Client Error. (Request ID: PvMw_VjBMjVdMz53WKIzP)

Repository Not Found for url: https://huggingface.co/api/models/%3Cnon_existent_repository%3E.
Please make sure you specified the correct `repo_id` and `repo_type`.
If the repo is private, make sure you are authenticated.
Invalid username or password.

GatedRepoError(受控仓库错误)

huggingface_hub.errors.GatedRepoError

< >

( message: str response: Optional = None server_message: Optional = None )

当尝试访问用户不在授权列表中的受控仓库时,会引发此错误。

注意:派生自 RepositoryNotFoundError 以确保向后兼容性。

示例

>>> from huggingface_hub import model_info
>>> model_info("<gated_repository>")
(...)
huggingface_hub.utils._errors.GatedRepoError: 403 Client Error. (Request ID: ViT1Bf7O_026LGSQuVqfa)

Cannot access gated repo for url https://huggingface.co/api/models/ardent-figment/gated-model.
Access to model ardent-figment/gated-model is restricted and you are not in the authorized list.
Visit https://huggingface.co/ardent-figment/gated-model to ask for access.

RevisionNotFoundError(找不到修订版本错误)

huggingface_hub.errors.RevisionNotFoundError

< >

( message: str response: Optional = None server_message: Optional = None )

当尝试访问具有有效仓库但修订版本无效的 hf.co URL 时,会引发此错误。

示例

>>> from huggingface_hub import hf_hub_download
>>> hf_hub_download('bert-base-cased', 'config.json', revision='<non-existent-revision>')
(...)
huggingface_hub.utils._errors.RevisionNotFoundError: 404 Client Error. (Request ID: Mwhe_c3Kt650GcdKEFomX)

Revision Not Found for url: https://huggingface.co/bert-base-cased/resolve/%3Cnon-existent-revision%3E/config.json.

EntryNotFoundError(找不到条目错误)

huggingface_hub.errors.EntryNotFoundError

< >

( message: str response: Optional = None server_message: Optional = None )

当尝试访问一个 hf.co URL 时,如果仓库和版本有效,但文件名无效,则会引发此错误。

示例

>>> from huggingface_hub import hf_hub_download
>>> hf_hub_download('bert-base-cased', '<non-existent-file>')
(...)
huggingface_hub.utils._errors.EntryNotFoundError: 404 Client Error. (Request ID: 53pNl6M0MxsnG5Sw8JA6x)

Entry Not Found for url: https://huggingface.co/bert-base-cased/resolve/main/%3Cnon-existent-file%3E.

BadRequestError

huggingface_hub.errors.BadRequestError

< >

( message: str response: Optional = None server_message: Optional = None )

当服务器返回 HTTP 400 错误时,由 hf_raise_for_status 抛出。

示例

>>> resp = requests.post("hf.co/api/check", ...)
>>> hf_raise_for_status(resp, endpoint_name="check")
huggingface_hub.utils._errors.BadRequestError: Bad request for check endpoint: {details} (Request ID: XXX)

LocalEntryNotFoundError

huggingface_hub.errors.LocalEntryNotFoundError

< >

( message: str )

当网络禁用或不可用(连接问题)时,尝试访问磁盘上不存在的文件或快照时引发此错误。该条目可能存在于 Hub 上。

注意:ValueError 类型是为了确保向后兼容性。注意:即使不是网络问题,LocalEntryNotFoundError 也派生自 HTTPError,因为 EntryNotFoundError

示例

>>> from huggingface_hub import hf_hub_download
>>> hf_hub_download('bert-base-cased', '<non-cached-file>',  local_files_only=True)
(...)
huggingface_hub.utils._errors.LocalEntryNotFoundError: Cannot find the requested files in the disk cache and outgoing traffic has been disabled. To enable hf.co look-ups and downloads online, set 'local_files_only' to False.

OfflineModeIsEnabled

huggingface_hub.errors.OfflineModeIsEnabled

< >

( )

当发出请求但环境变量设置为 HF_HUB_OFFLINE=1 时引发此错误。

遥测数据

huggingface_hub 包含一个用于发送遥测数据的辅助程序。这些信息可以帮助我们调试问题并确定新功能的优先级。用户可以通过设置 HF_HUB_DISABLE_TELEMETRY=1 环境变量随时禁用遥测数据收集。在离线模式下(即设置 HF_HUB_OFFLINE=1 时)也会禁用遥测数据。

如果您是第三方库的维护者,发送遥测数据就像调用 send_telemetry 一样简单。数据会在单独的线程中发送,以尽可能减少对用户的影响。

huggingface_hub.utils.send_telemetry

< >

( topic: str library_name: Optional = None library_version: Optional = None user_agent: Union = None )

参数

  • topic (str) — 正在监控的主题的名称。该主题直接用于构建 URL。如果您想监控子主题,只需使用“/”分隔。例如:“gradio”、“transformers/examples”……
  • library_name (str, 可选) — 发出 HTTP 请求的库的名称。将添加到用户代理标头中。
  • library_version (str, 可选) — 发出 HTTP 请求的库的版本。将添加到用户代理标头中。
  • user_agent (str, dict, 可选) — 用户代理信息,以字典或单个字符串的形式提供。它将与已安装软件包的信息一起完成。

发送遥测数据,帮助跟踪不同 HF 库的使用情况。

这些使用数据可以帮助我们调试问题并确定新功能的优先级。但是,我们理解并非所有人都希望分享额外的信息,我们尊重您的隐私。您可以通过将 HF_HUB_DISABLE_TELEMETRY=1 设置为环境变量来禁用遥测数据收集。在离线模式下(即设置 HF_HUB_OFFLINE=1 时)也会禁用遥测数据。

遥测数据收集在单独的线程中运行,以最大程度地减少对用户的影响。

示例

>>> from huggingface_hub.utils import send_telemetry

# Send telemetry without library information
>>> send_telemetry("ping")

# Send telemetry to subtopic with library information
>>> send_telemetry("gradio/local_link", library_name="gradio", library_version="3.22.1")

# Send telemetry with additional data
>>> send_telemetry(
...     topic="examples",
...     library_name="transformers",
...     library_version="4.26.0",
...     user_agent={"pipeline": "text_classification", "framework": "flax"},
... )

验证器

huggingface_hub 包含自定义验证器,用于自动验证方法参数。验证的灵感来自 Pydantic 中完成的验证类型提示的工作,但功能更有限。

通用装饰器

validate_hf_hub_args() 是一个通用装饰器,用于封装具有遵循 huggingface_hub 命名约定的参数的方法。默认情况下,所有已实现验证器的参数都将被验证。

如果输入无效,则会抛出 HFValidationError。只有第一个无效值会抛出错误并停止验证过程。

用法

>>> from huggingface_hub.utils import validate_hf_hub_args

>>> @validate_hf_hub_args
... def my_cool_method(repo_id: str):
...     print(repo_id)

>>> my_cool_method(repo_id="valid_repo_id")
valid_repo_id

>>> my_cool_method("other..repo..id")
huggingface_hub.utils._validators.HFValidationError: Cannot have -- or .. in repo_id: 'other..repo..id'.

>>> my_cool_method(repo_id="other..repo..id")
huggingface_hub.utils._validators.HFValidationError: Cannot have -- or .. in repo_id: 'other..repo..id'.

>>> @validate_hf_hub_args
... def my_cool_auth_method(token: str):
...     print(token)

>>> my_cool_auth_method(token="a token")
"a token"

>>> my_cool_auth_method(use_auth_token="a use_auth_token")
"a use_auth_token"

>>> my_cool_auth_method(token="a token", use_auth_token="a use_auth_token")
UserWarning: Both `token` and `use_auth_token` are passed (...). `use_auth_token` value will be ignored.
"a token"

validate_hf_hub_args

huggingface_hub.utils.validate_hf_hub_args

< >

( fn: CallableT )

引发

HFValidationError

验证作为 huggingface_hub 的任何公共方法的参数接收的值。

此装饰器的目标是统一在任何地方重用参数的验证。默认情况下,所有定义的验证器都会被测试。

验证器

  • validate_repo_id(): repo_id 必须是 "repo_name""namespace/repo_name"。命名空间是用户名或组织名。
  • smoothly_deprecate_use_auth_token(): 使用 token 而不是 use_auth_token(仅当被装饰的函数不需要 use_auth_token 时 - 实际上,在 huggingface_hub 中始终如此)。

示例

>>> from huggingface_hub.utils import validate_hf_hub_args

>>> @validate_hf_hub_args
... def my_cool_method(repo_id: str):
...     print(repo_id)

>>> my_cool_method(repo_id="valid_repo_id")
valid_repo_id

>>> my_cool_method("other..repo..id")
huggingface_hub.utils._validators.HFValidationError: Cannot have -- or .. in repo_id: 'other..repo..id'.

>>> my_cool_method(repo_id="other..repo..id")
huggingface_hub.utils._validators.HFValidationError: Cannot have -- or .. in repo_id: 'other..repo..id'.

>>> @validate_hf_hub_args
... def my_cool_auth_method(token: str):
...     print(token)

>>> my_cool_auth_method(token="a token")
"a token"

>>> my_cool_auth_method(use_auth_token="a use_auth_token")
"a use_auth_token"

>>> my_cool_auth_method(token="a token", use_auth_token="a use_auth_token")
UserWarning: Both `token` and `use_auth_token` are passed (...)
"a token"

HFValidationError

huggingface_hub.errors.HFValidationError

< >

( )

huggingface_hub 验证器抛出的通用异常。

继承自 ValueError

参数验证器

验证器也可以单独使用。以下是所有可以验证的参数列表。

repo_id

huggingface_hub.utils.validate_repo_id

< >

( repo_id: str )

验证 repo_id 是否有效。

这并非旨在取代 Hub 上进行的适当验证,而是为了尽可能避免本地不一致(例如:禁止在 repo_id 中传递 repo_type)。

规则

  • 1 到 96 个字符之间。
  • “repo_name” 或 “namespace/repo_name”
  • [a-zA-Z0-9] 或 ”-”, ”_”, ”.”
  • ”—” 和 ”..” 被禁止

有效: "foo""foo/bar""123""Foo-BAR_foo.bar123"

无效: "datasets/foo/bar"".repo_id""foo--bar""foo.git"

示例

>>> from huggingface_hub.utils import validate_repo_id
>>> validate_repo_id(repo_id="valid_repo_id")
>>> validate_repo_id(repo_id="other..repo..id")
huggingface_hub.utils._validators.HFValidationError: Cannot have -- or .. in repo_id: 'other..repo..id'.

https://github.com/huggingface/huggingface_hub/issues/1008 中讨论过。在 moon-landing(内部存储库)中

smoothly_deprecate_use_auth_token

不完全是验证器,但也会运行。

huggingface_hub.utils.smoothly_deprecate_use_auth_token

< >

( fn_name: str has_token: bool kwargs: Dict )

huggingface_hub 代码库中平滑地弃用 use_auth_token

长期目标是在代码库中删除任何提及 use_auth_token 的内容,取而代之的是一个独特且不太冗长的 token 参数。这将分几个步骤完成

  1. 步骤 0:需要对 Hub 进行读取访问的方法使用 use_auth_token 参数(strboolNone)。需要写入访问权限的方法具有 token 参数(strNone)。此隐式规则的存在是为了能够在不需要时不发送令牌(use_auth_token=False),即使已登录。

  2. 步骤 1:我们希望协调一切并在任何地方都使用 token(支持只读方法的 token=False)。为了不破坏现有代码,如果将 use_auth_token 传递给函数,则 use_auth_token 值将作为 token 传递,而不会发出任何警告。一个极端情况:如果同时传递了 use_auth_tokentoken 值,则会发出警告并忽略 use_auth_token 值。

  3. 步骤 2:发布后,我们应该推动下游库尽可能从 use_auth_token 切换到 token,但不要发出警告(例如,在相应的存储库上手动创建问题)。

  4. 步骤 3:经过一段过渡期(例如 6 个月,直到 2023 年 4 月?),我们将更新 huggingface_hub 以对 use_auth_token 发出警告。希望受影响的用户很少,因为它已经被修复了。此外,huggingface_hub 中的单元测试必须进行调整,以预期会发出警告(但仍然像以前一样使用 use_auth_token)。

  5. 步骤 4:在正常的弃用周期(3 个版本?)之后,删除此验证器。use_auth_token 将绝对不受支持。此外,我们更新 huggingface_hub 中的单元测试以在任何地方都使用 token

这已经在

< > GitHub 上的更新