卢首群对 DeepSeek 的看法

社区文章 发布于 2025 年 4 月 11 日

中国开源软件推进联盟 (COPU) 荣誉主席

摘要

DeepSeek 可视为中国当前人工智能的代表作,探索出一条人工智能发展的新路径,这或将改变世界人工智能发展格局,并引发全球人工智能的激烈竞争。DeepSeek 坚持开源创新。目前,它也是一种生成式自回归语言模型,不可避免地存在通用语言模型固有的局限性和幻觉等负面缺陷。本文作者建议 DeepSeek 应进行纠正,并向人工智能的发展方向转型。

  1. DeepSeek 最大的成功在于梁文峰的团队以创新姿态开辟了一条人工智能发展的新路径:“低投入、低成本、有限资源、高效率、高性价比(产出)”。

  2. DeepSeek 可被视为中国当前人工智能的代表作,正在改变世界人工智能的发展格局。它降低了全球公众和企业使用人工智能的门槛,为新兴力量发展人工智能开辟了一条平坦的道路。它否定了“巨额投资、高成本、海量资源、低效率、低性价比(产出)”的旧有发展人工智能的路径。

  3. 称梁文峰的团队是一群“国运”创新者或天才,毫不过分!

  4. 梁文峰团队坚持开源创新。开源有助于人工智能的迭代创新、稳定和升级以及生态系统的发展。DeepSeek 整合了大型模型 C 端的完全开源和 B 端开源商业模式的实施。它不仅实现了开源创新,还支持了开源产业的发展。这也是 DeepSeek 的一大创举。

  5. 有些人以此通过根据当前产出产品排名来压制 DeepSeek。事实上,DeepSeek 和其他大型生成式语言模型的产出性能不相上下,并没有夸大其词地说一个比另一个高的情况。如果我们以更科学的方式根据成本效益进行比较,DeepSeek 绝对是世界领先的。

  6. 目前,DeepSeek 的关键技术没有太多秘密。国内外一些大型生成式语言模型基本都已掌握 DeepSeek 的关键技术。到了人工智能竞争的下一个阶段,可以说大家都在同一起跑线上。

  7. DeepSeek 的出现引发了全球人工智能的激烈竞争。

  8. 当前的 DeepSeek 模型,像其他大型语言模型一样,都是一种生成式自回归大型语言模型。DeepSeek 存在局限性和负面缺陷,影响了其性能。在 DeepSeek 的发展中,重要的是要克服局限性,根除缺陷,大幅提高智能化水平,节约能源,提高效率,并扩大应用。

  9. 对于生成式自回归语言模型,由于语言无法取代现实世界,它缺乏世界知识,或者无法生成新知识来真正理解物理世界。此外,语言不等于思维,这也限制了操作过程中的思维深度,最终限制了所产生智能的水平。语言模型训练架构的自回归机制基于 Token 及其支持的信号处理和统计,这是幻觉的根本原因。

  10. DeepSeek,像其他标准和通用基础模型一样,很难直接转化为企业和行业的高质量生产力。它仍然需要提升其暂时缺失的商业价值。它们缺乏对企业和行业的深入理解。当它们真正应用于企业和行业的业务场景(如金融、制造、医疗等),为企业和行业创造价值时,它们必须捕获企业和行业的数据,然后应用它们来填补空白。

  11. 建议 DeepSeek 发展的一项重要任务是解决其偏差和转型问题,努力在全球激烈竞争中获胜。

  12. 校准 DeepSeek 的目标是开发真正先进的人工智能——通用人工智能 (AGI)。在开发 AGI 时,我们必须避免急于求成。要实现 AGI,我们必须首先开发人工智能在转型阶段的任务(如多模态、具身化、代理和世界模型等)。AGI 是一个具有自主系统的人工智能。AGI 正处于人工智能智能能否超越人类的十字路口。这关系到它是否影响人类安全,甚至影响到人类能否在地球上生存的极其严重的问题。在开发 AGI 以确保人类安全的预防措施时,它还需要世界各国在互信的基础上采取统一行动,并实施技术与管理(监管)相结合的政策。任务极其严峻和艰巨。

社区

注册登录以发表评论