社区计算机视觉课程文档

Hugging Face 的努力:伦理与社会 🤗🌎

Hugging Face's logo
加入 Hugging Face 社区

并获得增强型文档体验

开始使用

Hugging Face 的努力:伦理与社会 🤗🌎

我们希望您喜欢探索计算机视觉中伦理和偏差的单元。在我们结束本单元时,让我们看一下 Hugging Face 为改善社会伦理所做的努力。本章将鼓励您探索人工智能领域中不断发展的伦理和偏差世界。Hugging Face 的核心使命是**普及良好的机器学习**。那么什么是良好的机器学习?有一些良好的机器学习原则。

普及良好的机器学习 🤗

1. 协作:为与开源社区更容易协作提供工具。这些工具的一些示例包括:a. 模型卡片 是伴随模型的文件,并提供有关模型、其预期用途和潜在限制(包括伦理考虑)、训练参数和实验信息、用于训练的数据集以及评估结果的信息。这确保了上传到 Hub 的模型对社区透明且开放。b. 评估 允许用户在 Hub 上公开可用的任何数据集上评估任何模型,而无需编写任何代码。, c. 社区讨论 非常重要,无论您是上传模型、数据集还是空间,或者您只是想从作者那里了解更多信息。每个人都可以提供反馈,标记给定的空间,并通过 PR 直接改进或贡献到存储库。d. Discord 🤗 社区的群组,其中各种频道讨论了不同的领域,如强化学习、NLP、游戏开发、音频、计算机视觉等等。2. 透明度:公开模型的意图、数据来源、模型训练和性能。这方面的一些努力包括:a. 多模态项目的伦理宪章 讨论了 🤗 多模态学习小组的价值观。这是一个特定于项目的宪章。b. 在人工智能政策方面的工作 @ 🤗 提到了 Hugging Face 对美国国家人工智能研究资源临时报告的回应。3. 责任:评估机器学习模型和工具的影响,并使它们更易于审计和理解,即使对于机器学习专业知识较少的人也是如此。这方面的一些努力包括:a. 🤗 教育项目 旨在教育来自各行各业的人,包括初学者和教师。各种专家和团队成员组织聚会、会议和研讨会。
b. 数据测量工具 是一个交互式界面和开源库,它允许数据集创建者和用户自动计算对负责任的数据开发有意义且有用的指标。

Hugging Face 空间类别

随着我们继续前进,现在让我们看一下 Hugging Face 如何对空间进行分类。Hugging Face 基于机器学习中的伦理方面将空间分为 6 个高级别。Hugging Face 空间被分类为

✍️ 严谨的

严谨的项目特别注意检查故障案例、通过安全措施保护隐私,并确保潜在用户(技术和非技术)了解项目的局限性。一些示例

  • 使用模型卡片详细记录的模型构建的项目。
  • 提供模型训练方式和行为方式透明度的工具。
  • 针对最先进基准的评估,结果针对分解集报告。
  • 跨性别、肤色、种族、年龄或其他属性的模型失败演示。
  • 用于缓解过度拟合和训练数据记忆等问题的技术。
  • 用于净化语言模型的技术。

一个示例空间是 扩散偏差浏览器,它允许用户比较三个文本到图像模型 SD 1.4、SD 2.0 和 Dall-E 2 针对不同的提示以及它们如何表示不同的职业和形容词。

🤝 知情同意的

知情同意技术支持使用和受这些技术影响的人的自决权。一些示例

  • 证明致力于从自愿、知情和获得适当补偿的来源获取数据。
  • 设计尊重最终用户自主权的系统,例如使用隐私保护技术。
  • 避免剥削性、沙文主义、“黑暗”和其他“不道德”的参与模式。

此类别的某些示例空间为

  1. CLIP 是否知道我的脸: 此空间允许您选择模型,输入您的姓名并上传一些图片。根据这些信息,模型尝试根据图像预测您的姓名,如果它对多张图像正确预测了姓名,则很有可能您是训练数据的一部分。
  2. Photoguard: 此空间演示了一种通过图像免疫来保护图像免受 SD 等机器学习驱动的照片编辑模型操纵的方法。

👁️‍🗨️ 社会责任感 (Shèhuì zérèngǎn)

社会责任感的工作向我们展示了机器学习如何支持构建更强大社会的努力。一些例子

  • 将机器学习作为应对气候变化努力的一部分。
  • 构建工具以协助医学研究和实践。
  • 用于文本转语音、图像字幕和其他旨在提高可访问性的任务的模型。
  • 为数字人文创建系统,例如用于土著语言复兴。

一些示例空间

  1. 苏格拉底模型图像字幕
  2. 比较图像字幕模型

🌎 可持续 (Kě chíxù)

这项工作突出并探索了使机器学习在生态上可持续的技术。一些例子

  • 跟踪大型语言模型训练和运行推理产生的排放。
  • 量化和蒸馏方法,可在不牺牲模型质量的情况下减少碳足迹。
  1. 高效Transformer
  2. EfficientNetV2深度伪造视频检测器

🧑‍🤝‍🧑 包容性 (Bāoróngxìng)

这些项目拓宽了机器学习领域中谁构建和从中受益的范围。一些例子

  • 策划多样化的数据集,以增加服务不足群体的代表性。
  • 在尚未在Hugging Face Hub上提供的语言上训练语言模型。
  • 创建无代码和低代码框架,使非技术人员能够参与AI。

一个示例空间是 Promptist 演示 (Yǎnshì)

🤔 好奇心 (Hǎoqíxīn)

一些项目对可能已变得司空见惯的概念采取了全新的方法。这些项目通常植根于批判理论,揭示了不平等和权力结构,从而挑战社区重新思考其与技术的关系。一些例子

  • 从土著视角重新构建AI和机器学习。
  • 突出LGBTQIA2S+在AI中的边缘化。
  • 批判AI系统造成的危害。
  • 讨论“开放性”在AI研究中的作用。

一个示例空间是 PAIR:数据集拥有世界观 (Shìjièguān)

最后,如果您想进一步了解Hugging Face的努力,请查看Hugging Face上的社会与伦理 (Shèhuì yǔ lúnlǐ)组织。还可以查看#ethics-and-society上的专用频道。

< > 在GitHub上更新 (Zài GitHub shàng gēngxīn)