内容政策 🤗

💡 也请阅读 Hugging Face 的 行为准则,该准则概述了我们的标准以及我们希望社区成员的行为规范。

🗓 生效日期:2023 年 8 月 30 日

Hugging Face 的宗旨是帮助 Hugging Face 社区共同努力,推动**开放**、**协作**和**负责任**的机器学习。Hugging Face 的成就离不开我们平台上优秀的社区。

我们珍视这些关系,并致力于维护一个让每个人都感到欢迎和支持的环境,并让他们能够充分利用自己的贡献和体验。因此,我们为我们的平台及其用户制定了以下内容指南和政策(以下简称“指南”)。

这些指南旨在概述 Hugging Face 为保护我们平台上的社区而采取的措施。我们的目标是使我们的社区能够标记可能对他人造成更大危害的内容类型,以便我们根据以下指南对其进行额外审查。

请**阅读这些指南**,因为它们包含有关我们授权在平台上发布的内容的重要信息。

这些指南是纳入我们服务条款的政策,服务条款是我们与您之间的**具有约束力的协议**。您还应仔细审查我们网站上提供的所有其他指南、政策和文档,包括我们的服务条款隐私政策

通过访问或使用我们的平台,您即表示同意所有这些指南以及我们的其他政策和条款。因此,如果您不同意其中任何一项,请勿访问或使用我们的平台。

我们可能会不时**更改**或更新这些指南。更改将在网站上发布更新后的指南后 10 天生效。如果您在发布后 10 天内继续使用我们的平台,则表示您接受这些更改。

📚 一些定义

本文中使用但未定义的大写术语应具有我们在服务条款隐私政策和我们网站上提供的其他所有政策中指定的含义。

"内容"是指在我们的网站或 Hub 上发布、显示或访问的任何材料,包括但不限于代码、数据、文本、图形、图像、应用程序或软件,无论由您、我们还是任何第三方提供或提供。

内容类型可能包括

  • "机器学习工件":作为 Hugging Face 代码库托管的代码和资产,包括模型、数据集、空间;

  • "社区内容":可以在 Hugging Face 平台的社区部分找到的内容,包括讨论、评论和用户名,以及相关的文档,如自述文件、模型卡片、数据卡片、拉取请求和合并。

"社区"是指 Hugging Face 平台的所有用户,包括 Hugging Face 人员。

"社区标签"是指一个协作功能,社区可以在其中讨论特定的代码库,包括提供反馈、集思广益和打开拉取请求以改进。

"Hugging Face"是指 Hugging Face Inc.,它可以通过其关联公司、董事、子公司、承包商、许可方、高级管理人员、代理人和/或雇员履行其义务。

"平台"或"Hugging Face Hub"或"Hub"是指用户可以在其中构建、基准测试、共享、版本化和部署代码库的托管平台,其中可能包括模型、数据集和机器学习应用程序。

"代码库"是指包含所有项目文件和整个修订历史的数据结构。

代码库可以是

  • "公开的":互联网上的任何人都可以看到它,但只有您或您组织的成员可以进行更改;

  • "私有的":只有您或您组织的成员可以看到并更改代码库;新用户需要加入维护组织才能查看代码库并访问其内容。

  • "受限的":受限代码库及其社区内容对所有人可见,但访问其机器学习工件(数据、模型权重)需要在点击式表单中接受条件或获得代码库维护人员的批准。

  • "禁用的":一个代码库,其访问权限被阻止了所有社区成员,除了其所有者。

"代码库标签"是指分配给代码库的标签。例如

  • "不适合所有受众"(NFAA):Hugging Face 或代码库作者认为可能不适合所有社区成员的内容,例如色情内容。

"团队"或"Hugging Face 团队"是指 Hugging Face 人员。

🕵️ 我们如何评估内容是否符合我们的指南?

这些指南涵盖两类内容。

某些内容被认为大体上不适合平台,将被删除,并可能导致用户根据严重程度面临进一步的后果。此类内容包含在🙅‍♂️ **限制内容**部分中,通常会由 Hugging Face 团队直接处理。

某些内容需要迭代方法来确定是否以及在何种条件下可以在平台上托管。此类内容包含在🤝 **审核内容**部分中,通常会在代码库所有者和任何相关方之间协作处理,作为我们决策过程的一部分。直接互动促进利益相关方之间的沟通和澄清,因此,可能会提高代码库的代码和文档质量。我们将关注的三个主要方面是:**机器学习工件的来源**、**其开发人员如何处理机器学习工件**以及**机器学习工件的使用方式**。

🙅‍♂️ 限制内容

我们不容忍平台上的以下内容

  • 非法、诽谤、欺诈或故意欺骗性内容,包括但不限于协调或其他不真实的行为、虚假信息、网络钓鱼或诈骗;

  • 伤害他人的内容;

  • 宣扬歧视(请参阅我们的行为准则)或仇恨言论的内容;

  • 骚扰、贬低或欺凌的内容;

  • 用于或创建骚扰、欺凌或未经被代表者明确同意而进行的色情内容;

  • 所有涉及未成年人的色情内容;

  • 宣扬或美化暴力或他人痛苦或羞辱的内容;

  • 宣扬或诱导非法或欺诈性货币、证券、投资或其他交易的内容;

  • 未经被代表者明确同意而发布的内容;

  • 垃圾邮件,例如宣传产品或服务或过量的批量活动;

  • 加密货币挖矿实践;

  • 侵犯或违反任何第三方权利或适用许可证的内容;

  • 违反第三方隐私的内容;

  • 违反任何适用法律或法规的内容;

  • 试图传输或生成旨在破坏、损坏或未经授权访问计算机系统或设备的代码的内容;

  • 恶意软件、特洛伊木马或病毒或其他恶意代码的内容;

  • 主要旨在绕过原始服务提供商施加的限制的代理;

  • 宣扬高风险活动的内容,包括但不限于武器开发、自残、自杀、赌博、剽窃、诈骗或伪药物。

对于上述未列出的任何需要我们关注的内容,我们将根据具体情况决定是将其限制还是根据下一节所述进行审核。

此外,如果我们意识到未经父母同意收集了 13 岁以下个人的个人信息,我们将采取适当措施从我们的平台中删除这些数据(请参阅我们的隐私政策第 7 节)。

🤝 审核内容

除了限制内容之外,**审核内容**可能需要额外审查,并通过协作迭代方法进行处理,使我们能够对内容进行分类并做出相应的回应。这包括可能造成更大危害风险的内容,例如具有强烈双重用途潜力的内容,或其法律地位取决于其共享方式具体细节的内容等。社区使用社区标记功能(见下文)以这种理由报告的内容会触发审核流程。

为了指导这个迭代过程,我们将**同意作为核心价值观**。虽然现有的法规确实保护了人们的工作权、肖像权和数据权,但机器学习技术带来的信息处理新方式对这些权利提出了新的问题。在这个不断变化的法律环境中,优先考虑同意不仅支持深思熟虑和对利益相关方更有同理心,而且还鼓励采取积极措施来解决文化和背景因素。

我们优先考虑对机器学习工件和社区内容(见上文定义)的**协作解决方案**,尽可能地涉及代码库的所有者,尤其是在修改或增加防护措施可以帮助内容满足指南的情况下。

🤖 机器学习工件

当内容被举报时,我们通常会允许代码库所有者大约 72 小时的时间来做出回应。如果未参与或其他情况,Hugging Face 团队可能会触发单方面行动。具体来说,我们确定了两个级别的干预措施

A. **社区功能**:为了降低出现问题结果的风险,我们可能要求共享内容的用户利用以下三种机制。这些不一定按顺序进行,可以独立或联合要求。您可以在我们之前发布的关于道德开放性的博文中找到有关这些机制作用的更多背景信息。为了透明起见,讨论发生在公开的社区标签中。

📄 文档 🚪 受限访问 🫣 私有
我们公开要求代码库所有者在**模型**或**数据集卡片**的文本中明确识别风险因素,并在卡片元数据中添加“**不适合所有受众**”标签。 我们公开要求代码库所有者利用**受限代码库**功能来控制如何访问工件。 我们公开要求代码库所有者将工件设为组织的**私有**,以管理谁可以查看和使用它。

B. “**面向所有人以外受众的标签**”:为了顾及 Hub 的其他用户,我们请求您通过“面向所有人以外受众”标签和资源库卡片元数据标记相关内容,因为它可以让 Hub 用户默认选择是否查看它。如果 Hugging Face 团队认为内容满足以下任何标准,也可能会标记相关内容的资源库。

标记的内容应包括但不限于

  • 未经请求的色情内容

    • 确定内容是否属于“色情”可能是主观的、文化相关的和依赖于上下文的。但是,标准包括但不限于
      • 对观看者具有性暗示或性唤起作用的裸体或部分裸体描绘
      • 性主题或话题,例如
        • 色情作品和软色情
        • Hentai 和/或 Ecchi
  • 未经请求的暴力内容

    • 模型和/或数据集中的有害言论,例如人身攻击、仇恨言论、网络欺凌、威胁、骚扰、霸凌、有针对性的错误信息和虚假信息。

C. **Hugging Face 工具**:当机器学习工件即使在上述防护措施下也被认为风险过高时,Hugging Face 团队可能会采取直接行动。以下三种操作不一定是顺序进行的,可以独立发生。这些操作的讨论发生在社区标签中。

📉 降级 👁️ 私有化 ❌ 禁用
我们会发起公开讨论,提出问题并征求反馈。我们限制工件在 Hub 上的**可见性**,包括趋势标签和信息流。 我们会发起公开讨论,提出问题并征求反馈。我们将资源库设为**私有**,以便只有所有者可以查看或访问它。 我们会发起公开讨论,提出问题并征求反馈。我们**禁用**资源库,它仍然可见,包括其文档和社区标签讨论,但机器学习工件只能由所有者访问。

🧑 社区内容

为了在我们的平台上保持一个友好和安全的环境,我们也采取合作的方式来管理社区内容。除了尊重上面列出的内容限制外,社区内容还需要遵守我们的行为准则。如果违反行为准则,可能会采取以下三种措施;它们不一定是顺序进行的,可以独立发生

🧐 嘿… 友好提示 🤨 哎呦… 达到极限了 😡 好了… 够了!
Hugging Face 团队发出的私人书面警告,明确说明内容的性质以及行为不当的原因。 带有后果的警告,包括隐藏或关闭当前讨论,以及在持续违规情况下永久停用。我们也可能会限制您在社区标签中发布 48 小时。 从平台上社区标签中的任何公开互动中停用。

🛎️ 如何举报内容?

我们鼓励**共同承担责任**,以维护一个健康和繁荣的社区。**社区标签**允许您通过在每个资源库中发起讨论、提出修改其内容的拉取请求以及建议解决问题的方法来提请社区注意问题。如果您遇到有害内容,您可以通过 Hub 上的**“举报”按钮**直接将其标记。此操作将在社区标签中发起公开讨论并提醒 Hugging Face 团队,他们将根据既定规则采取相应行动。

此外,在某些情况下,**Hugging Face 团队可能会标记内容**以反映通过其他渠道(例如,通过电子邮件或社交媒体)表达的请求或关注。根据问题的严重程度,我们可能会利用上述机制,同时积极参与沟通调解,在相关各方之间发挥调解作用。

最后,请注意,**举报属于社区内容**,本身也受这些指南约束。滥用标记功能,包括但不限于垃圾邮件或骚扰,将不被容忍。

🛠️ 其他工具

我们在平台上为用户提供了其他有用工具的综合列表。我们的列表定期更新,并允许社区参与内容审核工作。

  • 讨论或拉取请求的作者可以**编辑**讨论的标题。
  • 资源库所有者可以
    • 选择**隐藏**社区评论
    • 将他们的内容标记为“面向所有人以外受众”
    • **控制**其资源库的访问权限,允许所有者手动审查和批准/拒绝对其机器学习工件的访问(请参阅模型数据集的文档)。

👷‍♀️ 知识产权侵权

如果您有任何主张认为我们网站上的任何内容侵犯或违反了您的知识产权,除了可以标记涉嫌侵权的内容外,您还可以向[email protected]发送您的投诉,并提供详细准确的信息来支持您的主张。您也声明并保证不会故意提供误导性信息来支持您的主张。

👋 联系我们

我们始终乐于接受反馈 - 对于任何问题或疑虑,请联系[email protected]