Hub 文档
附录
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
附录
附录 A:用户研究
关键问题的完整文本回复
你如何定义模型卡片?
见解:受访者对模型卡片的看法大致相似:文档侧重于训练、用例以及偏差/限制等问题
- 模型卡片是对模型的描述,包括它们的训练方式、用例以及潜在的偏差和限制
- 描述模型基本特征的文档,以便读者/用户理解他们面前的成果、背景/训练、如何使用以及其技术/伦理限制。
- 它们作为模型的鲜活成果,用于记录模型。模型卡片包含的信息从特定模型可以用于什么用途的高级描述,到限制、偏差、指标以及更多内容。它们主要用于理解模型的功能。
- 模型卡片之于模型,就像 GitHub README 之于 GitHub 项目。它告诉人们他们需要了解的关于模型的所有信息。如果你不写模型卡片,就没有人会使用你的模型。
- 据我理解,模型卡片使用某些基准(地理、文化、性别等)来定义模型的可使用性和局限性。它本质上是模型的“营养成分标签”,可以展示模型的创建方式并教育他人了解其可重用性。
- 模型卡片是关于模型的元数据和文档,是我正确使用模型所需了解的一切信息:关于模型的信息、哪篇论文介绍了它、它是在哪个数据集上训练或微调的、它属于谁、此模型是否存在已知的风险和限制,以及任何有用的技术信息。
- 我认为模型卡片是对模型的简要介绍,其中包括
- 模型架构特性的简短摘要
- 描述它训练使用的数据
- 在参考数据集上的性能(如果可能,包括准确率和速度指标)
- 局限性
- 如何在 Transformers 库的上下文中使用它
- 来源(原始文章、Github 仓库,...)
- 任何背景的人都可以轻松访问的文档,可以阅读并了解关键模型组件和社会影响
你喜欢模型卡片的什么?
- 它们对于教人们了解新模型很有趣
- 作为一个非技术人员,能够了解模型,理解模型的基础知识,这是作者以透明且可解释(即可信)的方式公开其创新的机会。
- 我喜欢带有视觉效果和小部件的交互式模型卡片,它们允许我在不运行任何代码的情况下尝试模型。
- 我喜欢好的模型卡片的原因是,你可以在其中找到关于特定模型所需的所有信息。
- 模型卡片对人工智能伦理领域具有革命性意义。它是减轻/教育机器学习中偏差的首批切实步骤之一。它们培养了更高的意识和责任感!
- 结构化、详尽,信息越多越好。
- 它有助于了解模型擅长(或不擅长)什么。
- 简洁性和可访问性
你不喜欢模型卡片的什么?
- 可能会变得过于技术性和/或密集
- 它们包含针对不同受众(研究人员、工程师、非工程师)的大量信息,因此很难根据预期用例浏览模型卡片。 * [注:此评论可以通过针对不同受众的切换视图来解决]
- 创建好的模型卡片很耗时。很难测试以确保信息是最新的。通常,模型卡片的格式完全不同 - 因此你必须弄清楚特定的人是如何构建他们的模型卡片的。 * [注:此评论有助于证明标准化格式和自动化工具的价值,以使创建模型卡片更容易]
- 如果没有社区的帮助来补充评估,模型卡片可能会受到开发者可能没有意识到的内在偏差的影响。现在还处于早期阶段,但如果没有更彻底的评估,模型卡片的信息可能会过于有限。
- 空模型卡片。没有许可信息 - 客户需要这些信息,但通常没有。
- 它们通常要么过于简洁,要么过于冗长。
- 写它们哈哈,保佑你
其他主要新见解
- 模型卡片最好由具有不同角色的人员填写:技术规范通常只能由开发人员填写;贯穿始终的伦理考量通常最好由那些倾向于处理伦理问题的人员提供信息。
- 模型用户非常关心许可证——特别是模型是否可以合法地用于特定任务。
附录 B:概况分析
机器学习中模型文档状态的概述
模型卡片示例
模型卡片和密切相关的变体的示例包括
- Google Cloud:人脸检测,物体检测
- Google Research:ML Kit Vision Models,人脸检测,Conversation AI
- OpenAI:GPT-3,GPT-2,DALL-E dVAE,CLIP
- NVIDIA 模型卡片
- Salesforce 模型卡片
- Allen AI 模型卡片
- Co:here AI 模型卡片
- Duke PULSE 模型卡片
- Stanford Dynasent
- GEM 模型卡片
- Parl.AI:Parl.AI 示例模型卡片,BlenderBot 2.0 2.7B
- Perspective API 模型卡片
- 有关更多示例,请参阅 https://github.com/ivylee/model-cards-and-datasheets!
大型语言模型的模型卡片
大型语言模型通常会随附相关文档发布。具有相关模型卡片(或相关文档工具)的大型语言模型包括
模型卡片生成工具
以编程方式或交互方式生成模型卡片的工具包括
- Salesforce 模型卡片创建
- TensorFlow 模型卡片工具包
- GSA / 美国人口普查局关于模型卡片生成器的合作
- Parl.AI 自动生成工具
- VerifyML 模型卡片生成 Web 工具
- 作为 vetiver 包一部分的模型卡片的 RMarkdown 模板
- Databaseline ML Cards 工具包
模型卡片教育工具
用于理解模型卡片以及理解如何创建模型卡片的工具包括
请引用为: Ozoani, Ezi and Gerchick, Marissa and Mitchell, Margaret. 模型卡片指南。Hugging Face,2022。https://huggingface.co/docs/hub/en/model-card-guidebook
< > 在 GitHub 上更新