开源人工智能:数字主权的基石
随着人工智能重塑从教育到国防的一切,数字主权不再是一个长期的愿望;它是一个紧迫的优先事项。为了确保各国能够治理、审计和塑造影响其社会的人工智能系统,开源人工智能为自主、创新和信任奠定了坚实的基础。
什么是数字主权?
数字主权是指一个国家或地区能够根据其自身法律、价值观和战略利益,独立地管理、控制和保护其数字基础设施、数据和技术的能力。这包括管理和维护数字资产的权限和技术能力,包括数据存储和处理、技术基础设施以及在一国境内使用的数字服务。
人工智能领域的数字主权提出了具体问题;人工智能尤其依赖于新规模的基础设施和数据,并被视为一种将直接影响工作、安全、经济、选举过程等领域的变革性技术。如果公民生活的这些方面都将受到单一技术范式的强烈影响,民主实体需要能够有意义地塑造其开发和部署方式。
数字主权的关键维度
- 数据主权:确保在一国境内生成的数据受其法律和治理结构管辖。例如,欧盟的《通用数据保护条例》(GDPR) 对欧盟公民的数据实施严格的数据保护标准,无论其数据在哪里处理。
- 技术主权:追求关键技术的自力更生,减少对技术供应商的依赖。这包括在云计算、5G网络和人工智能等领域发展国内能力。
- 基础设施主权:控制支持数字服务的物理和虚拟基础设施,例如数据中心、通信网络和云服务。欧洲的人工智能工厂提案等项目旨在建立联邦数据基础设施,以增强基础设施主权。
- 监管主权:在一国管辖范围内颁布和执行数字活动法律的权力。这包括数据隐私、网络安全和数字竞争方面的法规,并由数字主权的另外三个维度支持。
开源如何支持主权
开源人工智能模型使得检查架构、追溯决策制定过程以及理解其局限性成为可能。这对于民主监督至关重要。监管机构、研究人员和公民社会可以研究人工智能系统的工作原理,以及其技术特性如何满足或未能满足他们的要求。鉴于随着人工智能技术日益普及,对值得信赖和负责任的人工智能的需求不断增长,开源提供了评估合规性、公平性和安全性所需的可见性。
对于专有的人工智能模型,各国面临战略脆弱性:它们无法检查训练数据,无法纠正偏见,也无法确保访问的连续性或成本的稳定性,从而使其依赖于外部参与者。这对于政策、基础设施或创新而言并非坚实的基础。开源模型和(在更有限的程度上)开放权重模型改变了这种局面。例如,德国在其数字战略中明确提及开源,以此作为减少对非国内技术供应商依赖并支持国家人工智能生态系统发展的一种方式。
像OLMO2(一个相对较小的模型,训练方法和数据完全透明,性能与OpenAI的o1-mini相当)或OlympicCoder(一个更小的模型,在复杂的编程问题上超越了最新的Claude模型性能)这样的项目,展示了协作努力如何产生尖端人工智能模型,其内部工作机制从架构到训练数据文档都完全可访问。
开源人工智能模型可以在本地托管、修改和治理。这使得各国能够根据区域数据训练或微调模型,将其部署在主权基础设施上,并制定符合当地价值观(从语言到伦理再到法律)的政策。
数字主权的每个维度都直接受益于开源方法。当政府或公共利益团体可以在本国法律框架下,在本地数据集上微调或重新训练模型,而无需数据离开管辖范围时,数据主权得到维护。共享这些数据集能够开发更广泛的技术,这些技术基于符合法规的数据集,例如Common Pile v0.1,一个包含许可和开放域文本的数据集。技术主权通过学术研究人员和(本地)社区构建和维护核心人工智能能力(从模型架构到训练管道)而得到提升,而不是仅仅依赖专有API。这培养了国家和区域的专业知识。基础设施主权通过可在本地硬件(包括边缘设备或国家数据中心)上部署的开源模型得到支持,最大限度地减少对外国控制的云基础设施的依赖。像SmolVLM这样的轻量级模型展示了高性能人工智能如何在适度的基础设施上运行,使公共机构和初创公司能够在不外包控制权的情况下构建人工智能服务。最后,当模型的内部工作机制透明时,监管主权变得可操作:政府可以有意义地评估是否符合法律规范。总之,这些方面使开源人工智能不仅是一种技术资源,更是主权的战略推动者。
Hugging Face的Transformers库、Meta的LLaMA和Mistral模型等工具已经赋能了全球成千上万的开发者,使其能够根据本地需求试验、部署和调整强大的人工智能模型,例如针对印度语言的多语言模型Sarvam-M。
开源人工智能降低了进入门槛。它允许研究人员、小型公司和公共部门机构在最先进的模型基础上进行开发,而不仅仅是消费它们。这鼓励了自下而上的创新生态系统,并为本地人才为全球相关工具做出贡献创造了机会。开源人工智能不是将创新锁定在少数科技巨头手中,而是帮助各国发展自己的专业知识,这在人工智能驱动的世界中是一项至关重要的长期资产。
人工智能将塑造未来的规则、经济和价值观。开源确保这种权力是分散的、透明的和适应性强的,而不是集中在少数人手中。
对于任何致力于数字主权的政府或地区而言,投资开源人工智能并非妥协。它是通向一个建立在信任、独立和共同进步基础上的未来的最清晰、最民主的道路。