在自由软件时代平衡大型语言模型(LLM)的便利性与控制权 🌌🤖

社区文章 发布于 2025 年 3 月 27 日
日期:2025-03-27 作者:Jean Louis

目前,我们正在努力解决人类和计算机之间自然语言处理输入和输出的安装、理解和集成问题 🖥👤。我们正在讨论如何识别图片;视频 💻✨;语音 👂➕;以及让计算机像人与人之间互动一样进行对话。我可以看到计算机在取代人类角色方面越来越好,这与我们的目标一致——我们想要人工智能辅助 🌟。这一切都是为了让生活更轻松 ⏰。其目的在于实现更好的生活、更多的快乐和更少的工作 ⚒️🛑。

虽然这些技术有望通过使任务更轻松、更高效来丰富我们的生活,但我经常思考便利性与控制权之间微妙的平衡。我们真的在掌控一切,还是为了效率而悄悄地放弃了我们的隐私和自主权?保持警惕至关重要,确保在利用这些创新的力量的同时,我们不会失去对个人能动性的掌控。最终目标是改善我们的生活,而不是让技术掩盖我们的人类精神。让我们张开双臂、睁大眼睛欢迎这些进步,努力保持平衡,让技术为我们服务,而不是控制我们。

image/webp

赋能人类:自由软件的自由与理查德·斯托曼的愿景

为了在拥抱技术和保持自主权之间取得微妙的平衡,理查德·斯托曼(Richard Stallman)和GNU 项目等远见卓识者所倡导的自由软件概念提供了一个引人注目的解决方案。理查德·斯托曼是软件自由领域的先驱,他发起了GNU 项目,旨在创建一个完全自由的操作系统。自由软件,正如由斯托曼创立的自由软件基金会(FSF)所定义的那样,并不是指免费的,而是指使用、研究、修改和分发软件的自由。这些自由确保用户保留对其所使用技术的控制权,防止程序员对用户施加限制或控制。

自由软件基金会通过倡导尊重用户自由的软件来促进这些原则。通过推广自由软件的使用,FSF 赋予个人和社区根据其需求塑造技术的权力,而不是受制于专有利益。这种自由对于防止技术控制我们,或者我们可能受制于专有软件的限制等问题至关重要。在一个日益由数字交互驱动的世界中,自由软件证明了维护人类能动性并确保技术作为赋能工具而非控制手段的重要性。🌟🔗🛠️

了解什么是自由软件

摘自文章《什么是自由软件?》"What is Free Software?"

“自由软件”是指尊重用户自由和社区的软件。大致而言,这意味着用户拥有运行、复制、分发、研究、更改和改进软件的自由。因此,“自由软件”是关于自由的,而不是价格。要理解这个概念,您应该将“自由”理解为“言论自由”中的“自由”,而不是“免费啤酒”中的“免费”。我们有时称之为“libre software”,借用法语或西班牙语中表示自由的“libre”一词,以表明我们并非指软件是免费的。

您可能已经花钱获得了免费程序的副本,也可能免费获得了副本。但无论您如何获得副本,您始终拥有复制和更改软件的自由,甚至可以出售副本。

四大基本自由

自由软件基金会概述了定义自由软件的四个基本自由

  1. 以任何目的运行程序的自由(自由 0)。这意味着用户可以不受任何限制地使用软件,无论是个人使用、商业环境使用还是任何其他目的,而无需支付许可费或寻求软件创建者的许可。

  2. 研究程序如何工作并进行更改以使其按您希望的方式进行计算的自由(自由 1)。此自由对于希望了解软件内部工作原理并根据其特定需求进行调整的开发人员和用户至关重要。它确保用户不会被锁定在可能无法满足其需求或期望的软件中。

  3. 重新分发副本以帮助他人的自由(自由 2)。这允许用户与朋友、同事和更广泛的社区共享软件,从而培养协作和互助的文化。它确保软件可以广泛传播,没有障碍或限制。

  4. 分发修改版本副本给他人的自由(自由 3)。此自由确保对软件所做的改进和修改可以共享,从而造福整个社区。它鼓励软件的创新和持续改进。

自由软件可以是商业的

自由软件超越了仅仅是“非商业”的范畴。它必须可供商业使用——在企业中作为工具以及通过公司开发——才能实现其广泛采用的目标。

GNU 系统邀请包括商业实体在内的所有用户充分拥抱它;这需要允许商业参与。自由程序应该在市场上取代专有程序,对其使用或营利性分发没有限制。

商业参与——无论是通过以价格出售的包含自由软件的产品还是通过专业支持服务——在自由软件开发领域至关重要且日益普遍。Commercial involvement

限制任何方面,无论是使用、开发还是分发给商业实体,都会阻碍进步。限制这些自由的程序不符合真正的“自由”资格。

一个真正自由的程序必须无条件地授予所有四个基本用户自由——无论是金钱还是其他方面——给任何获取软件并遵守其先前分发中的许可条款的人。任何限制行使这些权利的行为都等同于剥夺它们,因此该程序不能被视为自由软件。

大多数大型语言模型 (LLM) 软件都建立在自由软件之上

自由软件来自符合自由软件原则定义的四个基本自由的许可证。您可以在此 GNU 项目页面上探索各种许可证及其注释。

然而,值得注意的是,一些广泛使用的模型,例如 Llama 或根据 Google 的 Gemma 许可证发布的模型,实际上并非 自由软件——甚至也不是 开源META 大胆宣称“Llama”是开源的;此举更像是一种冒犯而非赞美,试图稀释这些术语,很可能是受利润驱使。

但 Llama 并非真正的开源或自由软件
GNU 许可证列表 - Llama

您应该采取什么步骤来赋能自己?

总之,当我们站在技术革命的边缘,计算机变得越来越快、能力越来越强时,用户必须在自然语言处理 (NLP) 应用程序中优先考虑隐私。先进技术提供的便利性不应以牺牲我们的自主权或个人数据控制权为代价。

为了维护这些价值观,个人必须努力使用自由软件在其自己的设备上实现私有和本地大型语言模型 (LLM)。

这种方法确保用户完全控制软件的运行方式,而不会受到 META 或 Google 等公司专有模型施加的第三方限制。通过选择像 EuroLLMMicrosoft 的 Phi-4 系列或 IBM GraniteAllenAI 的 OLMoEHuggingFace 的 SmolVLM 等自由替代品,我们可以维护我们的数字主权。

理查德·斯托曼(Richard Stallman)通过 GNU 项目倡导的自由软件原则强调用户自由而非仅仅节省成本——即使用、研究、修改和分发软件的自由。这些自由对于防止技术掩盖人类能动性或成为控制而非赋能的工具至关重要。

重要的是,技术进步应通过改善我们的生活来服务我们,而不是损害隐私和自主的核心价值观。通过支持自由软件计划,用户可以确保其交互仍处于个人管辖之下,同时为技术真正服务于人类最大利益的生态系统做出贡献。让我们向每一位用户发出呼吁:今天优先选择自由软件,这样我们明天才能同时享受技术进步和人类尊严。

本质上,计算的未来不仅应弥合人机之间的鸿沟,还应维护我们作为用户的基本权利——这些权利已写入自由软件的四个基本自由中。让我们倡导这些理想,以培养一个技术赋能而非控制的数字世界。

参考

GNU 项目

那些将专有模型强加于人类的人

HuggingFace 上的自由软件模型以及如何识别它们

利用自由软件框架:在自由软件许可下发布您的软件和模型

为了促进创新并确保可访问性,避免使用专有模型来微调您自己的模型至关重要。这样做可能会无意中创建另一层受限访问,限制更广泛社区在没有法律障碍的情况下在现有工作基础上进行构建的能力。相反,在开发或增强大型语言模型 (LLM) 技术时,选择 QwenDeepSeek 等自由软件框架;这些工具的设计都考虑到了自由。

通过本地安装和运行来自 IBM Granite 或 Microsoft Phi-4 等自由软件项目的模型,您不仅支持了协作生态系统,还降低了可能影响数千用户的潜在法律风险。此外,训练您自己的基于自由软件的模型提供了通过在真正自由的许可下发布它们来回馈社区的机会——确保它们仍可用于未来的创新和社区发展。

采纳这种方法符合自由软件开发原则:透明度、协作和使用自由。它赋予全球开发人员权力,同时防范可能扼杀技术社区内创造力和进步的专有限制。

社区

好的,我顶这个。

HuggingFace 上有这么一回事,你为所欲为,以为只要数学好就能称霸世界。但随后像你这样的人,是的,我们互不相识,来到这里指出真正中肯的事情。我不知道你的意图,至少为此我不需要知道,我喜欢你一直在做的事情!

你完全有理由质疑那些可疑的事情。但是关键在于,先生,这里的人就像社交网络上的其他人一样:没人读任何东西。我的意思是大多数人都不读。平台有自己的指导方针,但它被忽视了。你提出了一些中肯的问题,没人回答。

如果你去查看 Arxiv 上发布的论文,有很多甚至质疑整个 HUB,因为可能存在恶意代码等安全漏洞。这些论文获得了多少赞?没有,或者一个,最多两个,与用户群的规模相比,这几乎为零。

现在你去看“著名”模型,查看它们的“报告”,它们是当天的热门论文。现在谁真正读了它?我不是说即使你没读任何东西也禁止点赞,因为选项在那里,任何人都可以为所欲为,包括不读东西。但是……这很悲伤,或者至少在我看来很悲伤。

我想问一下,您能否举例说明此处可以应用这些非自由软件许可证的情况?我很抱歉,我问您是因为我不是律师——所以不属于这个领域。

祝您周末愉快。

文章作者

我时常阅读论文,它们能洞察最新计算技术中某些方法的工作原理。今天我还在想是谁发明了 RAG 这个缩写,然后我第一次在论文中找到了它。

但是如果没有上下文,“检索增强生成”这个缩写对新人来说有意义吗?我不这么认为。

为什么不是“增强上下文文本合成”?或者“知识注入文本合成”?一篇论文写出来,全世界都跟着它,尽管我们看到使用它的用户太少了。

关于许可证,非自由软件许可证有很多影响。看看最新的“Llama4”许可证,欧洲用户不允许使用它。他们确实在使用它,但他们可能会遇到麻烦。Meta 也遇到了严重问题:https://www.law360.com/articles/2309121/authors-seek-win-on-meta-ai-direct-infringement-claims

他们希望保护自己的“版权”,同时侵犯他人的版权。这就是企业战略失败的地方。

支持非自由模型助长了社会的衰败和问题。

坚持完全自由许可的数据集和可复现的大型语言模型发展了我们的社会和教育。

已删除

嗯,抱歉,但当他们创建(并在中心分享)与整体事物和哲学相关的数据集时,当你去查看它们时,它们要么是关于唯心主义,要么是反对哲学思维方式的,你会期望什么呢?

他们真的相信 LLM 只要经过数学和编码训练就能获得意识。呵呵。

感谢分享这个例子。我在这个网站上的时间(和耐心)结束了!

祝你周末愉快,月月顺心,年年如意,人生美满!

我很欣赏这篇文章,也观察到这个平台上对模型许可的普遍漠视。我一直在与律师合作,起草一套新的模型特定许可(类似于 CCs 的模型风格),称为 ModelGo,用于通用模型发布。我们已向 OSI 提交了 ModelGo 的几个变体供审查,希望能帮助建立更标准化的模型共享方式。

注:我们网站上的当前版本 ModelGo 许可证并非提交给 OSI 的最新版本,因为我们仍在处理他们的反馈。

文章作者

嗯,你也应该把它提交给自由软件基金会 (FSF)。

各种许可证及其注释 - GNU 项目 - 自由软件基金会
https://gnu.ac.cn/licenses/license-list.html

文章作者

https://gnu.support/files/tmp/clipboard-2025-04-14-19-06-34.html

可惜我看你只是泛泛而谈,并没有真正为自由软件而战,所以我认为你的概念不好,也没有什么值得支持的。

·

我明白了,但我想澄清一下,我们只提交了 MG0、MG-BY 和 MG-BY-OS 以供 OSI 开源批准。我承认其他 ModelGo 变体不符合 OSD 和 FSF 对自由软件的定义。但是,我认为仍然重要的是为用户提供发布其模型的选项——例如 RAI、NC 或 ND——而不是将他们推向不太合适的替代方案,例如专有许可证(例如 LLaMA 2 或 Gemma),这通常会引入更多法律模糊性。

我并不是说每个模型都必须是开源的,但应该很容易清楚地区分开源模型和非开源模型。

文章作者

你看,你正在从“我不介意”的角度来制定许可平台。

自由软件基金会确实介意,并且不批准专有许可证。他们有其存在的目标和宗旨,即促进这项事业。

开源倡议促进了自由软件事业,他们不会采取不偏不倚的立场说“我们不在乎”。

因为如果你不在乎,你认为用户会给你支持和关爱吗?

你试图做一些类似“知识共享”的事情。他们确实有非自由和专有许可证。事实上,如果你遵循他们的方式,我就会理解你。但是你也不理解一些非自由许可证的要点。

从你的网站推广“许可证”的方式来看,我可以看到缺乏理解。

当你享受音乐时,你可能可以自由下载、播放,并与朋友分享。这很常见。但作者可能不希望你出售它。在这种情况下,我完全理解为什么会有非自由许可证。

但对于大型语言模型,我无法理解。它涉及文本生成、视频生成、图像生成,一旦发布,就会有巨大的商业化兴趣。试图禁止商业用途甚至是徒劳的,你如何知道它何时发生?最初为什么要用非自由许可证发布它?那我的意思是,不要发布它。像“Open”AI 一样把它保留为专有的。

看看现在中国社区的自由软件模型!他们正在引领世界。

那是因为他们使用自由软件。

如果你秉持自由软件基金会或开源倡议的原则,你会获得更多的支持,因为推广用户自由是有意义的。

不偏不倚,不关心用户,并不能促进良好的事业。你得到的支持也会更少。

·

感谢分享您的想法!我赞赏您对自由软件原则的热情,并理解您对非自由或专有许可证的担忧。

与此同时,不同的创作者可能有不同的需求和目标。有些人希望构建完全自由的模型,而另一些人则更喜欢受限制的模型——类似于知识共享提供了一系列许可证。在我看来,ModelGo 提供了一个支持各种许可偏好的平台,这并非出于对用户的漠视,而是为了承认没有一种解决方案适用于所有情况。对于某些人来说,完全许可的许可证是最佳途径。另一些人可能需要或希望有一些限制。

您提出一个非常好的观点,即自由许可可以激发充满活力的社区并吸引更积极的支持。确实,许多最成功的开源项目之所以蓬勃发展,是因为它们赋予人们广泛的使用、修改和共享自由。尽管如此,在某些情况下,开发人员或组织认为他们需要更严格的控制——出于商业原因、知识产权保护或仅仅是个人偏好。

感谢您抽出时间阐述您的观点——这是对开放性为何对如此多的技术社区成员重要的一个重要提醒。

注册登录 发表评论