为什么我们(不)需要出口管制

社区文章 发布于 2025 年 2 月 1 日
A whale doing science

导言 - Dario Amodei 的观点

最近,Anthropic 的联合创始人兼首席执行官、OpenAI 前成员 Dario Amodei 发表了一篇题为《关于 DeepSeek 和出口管制》的短篇博客文章:该文章的第一部分包含了一些关于 AI 模型、扩展定律和曲线平移的有趣思考,第二部分则分析了 DeepSeek 的两个最新版本(DeepSeek V3 和 R1)。如果说前两部分,除了某些可能听起来过于主观的考虑之外,与我们最近几天从最挑剔的专家那里听到的关于 DeepSeek 的评论相差无几,那么 Amodei 深入探讨我们为什么要对中国实施芯片出口管制的第三部分,不仅具有争议性,而且遗漏了一些与 DeepSeek 以及整个开源生态系统相关的要点。

在这篇简短的文章中,我将阐述 Anthropic 首席执行官论点中的一些重要观点,并报告我的想法以及我认为对该问题很重要的其他考虑。

正论与反论

在本节中,我将按如下方式进行:我将逐字引用 Amodei 在其文章中提出的一个主张,然后报告我对该主张的看法。每对正论与反论之间用一条线隔开。

  • "如果美国实验室尚未发现 DeepSeek 开发的效率创新,那么美国和中国实验室很快就会将其应用于训练数十亿美元的模型。"

这是 Anthropic 首席执行官在他的文章中遗漏的主要一点:DeepSeek 的创新是**开放**和**可复现**的,这是因为该模型是开源的,并附有一篇技术论文,详细说明了 DeepSeek 团队用于优化训练、提高效率的技术。Amodei 低估了这些信息的力量及其对科学界可能产生的影响,他说“如果美国实验室尚未发现它们”,但 DeepSeek 论文的影响已经显而易见:像 **HuggingFace** 这样的公司已经开始**公开**复现 DeepSeek R1,其他公司也开始基于 DeepSeek 的思想构建扩展的合成数据集,例如 OpenThoughts 的OpenThoughts-114k或 Magpie-Align 的Magpie-Reasoning-V2-250K-CoT-Deepseek-R1-Llama-70B。此外,在 HuggingFace Models Hub 上简单搜索“deepseek”会显示超过 3000 条结果,如果在 Datasets Hub 中输入相同的查询,则会显示近 300 条结果。这种影响是显而易见的,它不仅影响了“美国实验室”,而且无处不在,并扩展到世界各地的个人开发者和其他实验室,使他们能够获得**强大且可复现的技术**,并加速了人工智能的民主化。Claude(Anthropic 的旗舰模型)以及 OpenAI 的大多数模型则并非如此:它们被封闭源代码的帷幕所掩盖,因此无法完全复现。


  • "这意味着在 2026-2027 年(Amodei 预测我们将达到比人类更智能的 AI 时),我们可能会面临两种截然不同的世界。在美国,多家公司肯定会拥有所需的数百万芯片(耗资数百亿美元)。问题是中国是否也能获得数百万芯片。

    • 如果他们能做到,我们将生活在一个**两极世界**,美国和中国都拥有强大的人工智能模型,这将导致科学和技术飞速发展——我称之为“数据中心里的天才国家”。一个两极世界不一定会无限期地保持平衡。即使美国和中国在人工智能系统上处于均势,中国似乎也更有可能将更多的人才、资金和精力投入到该技术的军事应用上。再加上其庞大的工业基础和军事战略优势,这可能有助于中国在全球舞台上取得压倒性领先,不仅在人工智能领域,在所有领域都是如此。
    • 如果中国**无法**获得数百万芯片,我们将(至少暂时)生活在一个**单极世界**,只有美国及其盟友拥有这些模型。目前尚不清楚单极世界是否会持续下去,但至少存在这样一种可能性:由于人工智能系统最终可以帮助制造更智能的人工智能系统,暂时的领先可以转化为持久的优势。因此,在这个世界中,美国及其盟友可能会在全球舞台上取得压倒性和长期领先。”

Amodei 采用了“两个世界”的场景,这是一种众所周知的辩论技巧,旨在让听众面对两种截然对立的观点,一种支持作者的论点,一种反对作者的论点。这种技巧之所以特别有效,是因为:(a) 它将所有可能的场景缩小到两个,将复杂的问题简化为两种(通常更简单)解释现实的方式,从而将所有灰色两极分化为黑白;(b) 它迫使听众根据通常具有强大修辞意象和情感刺激对比来选择一方。在这两种场景中,Amodei 描绘了一个两极世界,其中中国最终将集中人才、资金和资源来确立其主导地位,以及一个单极世界,其中美国将掌握人工智能力量。让我们对此进行分析。

  1. 这两种情景并不是唯一可能的:当人工智能是开源的(例如中国的情况,DeepSeek以及Qwen和其他公司),科学可以进步,许多人,从个人到实验室,都可以复现它。尽管不可否认中国和美国比世界其他国家拥有巨大优势,但在一个非单极、鼓励开源的世界中,仍然存在一个**去中心化和民主化**的人工智能生态系统的潜力。
  2. 中国将人工智能进步投资于军事领域的假设完全忽视了美国已经这样做的现实:11 月,Meta 和**Anthropic 本身**(Amodei 的公司)允许美国政府访问他们的模型用于安全和国防应用;你可以在Gerrit De Vynck 在《华盛顿邮报》上的一篇文章中阅读到很好的总结,但也有 Meta 的帖子和 Palantir(Anthropic 在该交易中的合作伙伴)的帖子讨论了这个问题。Amodei 本人,在 2024 年 10 月的一篇文章中指出:“我目前猜测的最佳方法是“缓和战略”,即民主国家联盟通过确保其供应链、快速扩张以及阻止或延迟对手获得芯片和半导体设备等关键资源,从而在强大的人工智能领域获得明显优势(即使只是暂时的)。这个联盟一方面将利用人工智能实现强大的军事优势(大棒),同时提供将强大人工智能的好处(胡萝卜)分配给更广泛的国家群体,以换取支持联盟促进民主的战略(这有点类似于“原子能和平利用”)。”
  3. 但是,我们不妨按照 Amodei 的逻辑来思考:假设美国需要掌握权力。那么,Amodei 写到“民主国家联盟”,但从他在关于 DeepSeek 的博客文章中的视角来看,世界将是单极的,由“美国及其盟友”主导:实际上,这将是美国独领风骚,因为其盟友,特别是欧盟,都没有足够的实力为这种主导地位做出重大贡献(这也是他称之为**单极**的原因)。关键在于:美国真的那么值得信赖吗?我们真的应该把开发(大部分是闭源的)人工智能的权力交给那些屈服于当前政治治理、并随着政府更迭而改变立场的提供商吗?显然,我无意否认中国侵犯人权、大规模控制政策和缺乏民主的罪行,这些比美国普遍发生的情况糟糕得多,但我需要明确一点:如果我们有一个多极世界,制衡机制、科学的自我纠正机制可以介入并识别/消除/纠正中国模型以及欧洲和美国模型中存在的问题和偏见,特别是当这些模型的开发是**开源**的时候。如果少数公司将人工智能掌握在手中,在闭源的幕后开发,并从内部控制其模型,而不接受更广泛科学界的验证,那么我们可能会有更频繁的偏见和错误,而这些偏见和错误会因为没有人检查权重、训练过程和所使用的技术而 simply go unnoticed。

  • "严格执行的出口管制是唯一能阻止中国获得数百万芯片的措施,因此也是决定我们是最终走向单极世界还是两极世界的最重要因素。"

严格执行的出口管制确实能决定是走向单极世界还是两极(或如我所见,多极)世界,这是无可否认的。但其隐含的意义则不那么明显。想象一下,如果下一个“威胁”美国人工智能优势的模型来自欧洲:按照同样的逻辑,如果美国想要保持其在该技术领域的领先地位,他们也会对欧洲实施出口限制。也许他们不会像对中国那样严格,因为大多数欧洲国家都符合 Amodei 文章中“民主”的概念,但这足以让任何欧洲公司在竞争中位居第二/第三/第四,从而确保美国公司登上领奖台,或者至少是第一名。今天对中国实施“严格执行的出口管制”制造了一个危险的先例,未来美国可能会再次(尽管规模可能不同)对欧洲或任何他们认为可能对其领导地位构成威胁的国家这样做。

结论

鉴于我所写的一切,在阅读了 Amodei 关于多极化的观点后,我感到不得不提出一个非常重要的问题:

单极化如何有助于科学的进一步发展?现代科学,从定义上讲,难道不是建立在多极化、共享和基于科学界评审的自我纠正机制之上的吗?

在中世纪到十七世纪之间,当欧洲人将知识的控制权交给教会机构时,我们经历了难以言喻的暴行,包括基于种族、性别和宗教信仰的大屠杀、迫害和普遍歧视。在十七世纪和十八世纪之间,先是科学革命,后是启蒙运动,促成了知识的民主化(想想狄德罗及其同事的《百科全书,或科学、艺术和技艺的理性字典》),这为现代民主、人权和现代科学奠定了基础。正如你所看到的,尽管向现代科学和共享知识的过渡伴随着一些副作用,**开放知识**带来了我们所生活的世界的改善:从公元 700 年到 1700 年,大多数欧洲人都是文盲、贫困并受到当权者的虐待:短短 300 年间,大约 8 亿人的生活发生了根本性的变化,大部分是积极的。我认为这是一个有趣的例子,我们可以将其铭记在心,以备将来之用。

那么,我的简短结论总结了我的主要观点:我们需要更多的开源和更多像 Hugging Face🤗 这样的公司——这是我们真正推动人工智能进步的唯一途径,因为进步不是通过战争和限制实现的,而是通过协作实现的。

社区

注册登录 发表评论