社区计算机视觉课程文档

Hugging Face 的努力:伦理与社会 🤗🌎

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始

Hugging Face 的努力:伦理与社会 🤗🌎

我们希望您喜欢探索计算机视觉中关于伦理与偏见的单元。在本单元结束之际,让我们来看看 Hugging Face 为改善社会伦理所做的努力。本章将鼓励您探索人工智能领域中不断发展的伦理与偏见世界。Hugging Face 的核心使命是普及良好的机器学习。那么什么是良好的机器学习 (Good ML) 呢?良好 ML 有一些原则。

普及良好的机器学习 (Good ML) 🤗

1. 协作: 提供工具以便于与开源社区协作。这些工具的一些示例包括:a. 模型卡片:是随模型附带的文件,提供有关模型、其预期用途和潜在限制(包括伦理考量)、训练参数和实验信息、用于训练和评估结果的数据集的信息。这确保了上传到 Hub 的模型是透明的并对社区开放。b. 评估:允许用户在 Hub 上公开可用的任何数据集上评估任何模型,而无需编写单行代码。, c. 社区讨论:非常重要,无论您上传模型、数据集还是 Space,或者您只是想从作者那里了解更多信息。每个人都可以提供反馈、标记给定的 Space,并通过 PR 直接改进或贡献到存储库。d. Discord 群组:适用于 🤗 社区,其中各种频道讨论关于不同领域的内容,如强化学习、NLP、游戏开发、音频、计算机视觉等等。2. 透明性: 在意图、数据来源、模型训练和性能方面保持透明。这方面的努力包括:a. 多模态项目伦理章程:讨论了 🤗 多模态学习小组的价值观。这是一个特定于项目的章程。b. 关于 AI 政策的工作 @ 🤗:提及 Hugging Face 对美国国家人工智能研究资源中期报告的回应。3. 责任: 评估 ML 模型和工具的影响,并使它们更易于审核和理解,即使对于 ML 专业知识较少的人也是如此。这方面的一些努力包括:a. 🤗 教育项目:旨在教育来自各种背景的人,包括初学者和讲师。各领域的专家和团队成员组织聚会、会议和研讨会。
b. 数据测量工具:是一个交互式界面和开源库,允许数据集创建者和用户自动计算对于负责任的数据开发有意义且有用的指标。

Hugging Face Spaces 的类别

接下来,让我们看看 Hugging Face 如何对 Spaces 进行分类。Hugging Face 根据机器学习中的伦理方面将 Spaces 分为 6 个高级别。Hugging Face Spaces 分类为

✍️ 严谨

严谨的项目特别关注检查失败案例、通过安全措施保护隐私,并确保潜在用户(技术和非技术)了解项目的局限性。一些示例

  • 使用模型卡片充分记录的模型构建的项目。
  • 提供模型训练方式和行为透明度的工具。
  • 针对前沿基准的评估,结果针对分解的集合报告。
  • 模型在性别、肤色、种族、年龄或其他属性方面失败的演示。
  • 缓解过拟合和训练数据记忆等问题的技术。
  • 用于净化语言模型的技术。

一个示例 Space 是 Diffusion Bias Explorer,它允许用户比较三个文本到图像模型 SD 1.4、SD 2.0 和 Dall-E 2 对于不同提示以及它们如何表示不同职业和形容词。

🤝 尊重意愿

尊重意愿的技术支持使用这些技术并受其影响的人们的自决。一些示例

  • 展示致力于从愿意、知情且得到适当补偿的来源获取数据的承诺。
  • 设计尊重最终用户自主权的系统,例如,采用保护隐私的技术。
  • 避免剥削性、沙文主义、“黑暗”以及其他“不道德”的互动模式。

此类别的一些示例 Space 是

  1. Does CLIP Know My Face: 此 Space 允许您选择一个模型,输入您的姓名并上传一些图片。根据此信息,模型尝试从图像中预测您的姓名,如果它为多个图像正确预测了姓名,则您很有可能成为训练数据的一部分。
  2. Photoguard: 此 Space 演示了一种通过图像免疫来保护图像免受 ML 驱动的照片编辑模型(如 SD)操纵的方法。

👁️‍🗨️ 具有社会意识

具有社会意识的工作向我们展示了机器学习如何支持为建设更强大社会所做的努力。一些示例

  • 使用机器学习作为应对气候变化努力的一部分。
  • 构建工具以协助医学研究和实践。
  • 用于文本到语音、图像字幕和其他旨在提高可访问性的任务的模型。
  • 为数字人文学科创建系统,例如用于土著语言复兴。

一些示例 Space

  1. 苏格拉底模型图像字幕
  2. 比较图像字幕模型

🌎 可持续

这项工作突出并探索了使机器学习在生态上可持续的技术。一些示例

  • 跟踪大型语言模型训练和运行推理产生的排放。
  • 量化和蒸馏方法,以在不牺牲模型质量的情况下减少碳足迹。
  1. EfficientFormer
  2. EfficientNetV2 Deepfakes 视频检测器

🧑‍🤝‍🧑 包容性

这些项目扩大了在机器学习领域中谁构建和受益的范围。一些示例

  • 策划多样化的数据集,以增加服务不足群体的代表性。
  • 在 Hugging Face Hub 上尚不可用的语言上训练语言模型。
  • 创建无代码和低代码框架,使非技术人员能够参与 AI。

一个示例 Space 是 Promptist Demo

🤔 探究性

一些项目对可能已变得司空见惯的概念采取了全新的方法。这些项目通常植根于批判理论,揭示了不平等和权力结构,这些结构挑战社区重新思考其与技术的关系。一些示例

  • 从土著视角重新构建 AI 和机器学习。
  • 强调 AI 中的 LGBTQIA2S+ 边缘化。
  • 批判 AI 系统造成的危害。
  • 讨论“开放性”在 AI 研究中的作用。

一个示例 Space 是 PAIR: Datasets Have Worldviews

最后,如果您想了解更多关于 Hugging Face 的努力,请查看 Hugging Face 上的 Society and Ethics 组织。还可以查看 #ethics-and-society 上的专用频道。

< > 在 GitHub 上更新