契约的废墟：黑盒涌现、跨国套利与利维坦的降临

引言：洞穴的幻象与制度的飞地

如果一只飞虫被困在树叶的一处环形孔洞边缘，它会在那个二维平面里无休止地打转，并由此构建出一套完美自洽的宇宙观。在这个封闭的逻辑闭环里，它永远无法想象树叶之外还存在着立体的森林与风暴。这也如同被锁在柏拉图洞穴里的囚徒，将墙壁上的火光倒影奉为唯一的绝对真理。

绝大多数时候，人们也是这样在既定的轨道上运转的。如果缺乏对系统底层的向外探索与智识叩问，个体便只会在别人划定好的规则里进行日常的资源置换与微观博弈。这种在威廉姆森（Oliver Williamson）社会分析框架[1]中被称为 L4（日常资源配置）的忙碌，不仅剥夺了向上的视野，更会让人产生一种极其危险的错觉：误以为眼前的现实是唯一必须发生的，误以为当下的游戏规则是不可撼动的自然法则。

但现实从来不是必然的必然。所有的契约、制度与技术生态，不过是在特定的历史横截面上，各种力量博弈后形成的一种偶然的“可能性”。

带着这种试图打破洞穴幻象的执念，去审视本土过去四十年关于知识财产权的历史，便会发现一种极其荒诞的错位。作为一个后发经济体，这片土地在过去的狂飙突进中，面对的从来不是技术前沿的“创造性无政府状态”。此地的正式制度（L2），尤其是知识产权法律，并不是技术创新在与旧秩序的血肉摩擦中自然生长出来的契约，而是一整套为了拿到全球贸易入场券而“整体进口”的壁垒。

因为是借来的规则，它在本土底层的非正式制度（L1）——即深层的文化习惯、商业伦理和生存本能——中，从一开始就缺乏真正的敬畏与共识。在漫长的追赶期里，主导此地的商业逻辑是模仿、消化与微创新，“产权保护”往往被视为一种需要绕过的阻碍，而非激励创新的神圣契约。

然而，大模型（LLM）的降临，极其粗暴地打破了这种追赶者洞穴里的确定性。这个拥有“黑盒涌现能力”的全新物种，史无前例地将所有人同时拉到了技术的最前沿。当大洋彼岸的法官们都在为如何用旧版权法框定“概率的涌现”而焦头烂额时，本土那套原本就缺乏底层共识的舶来品 L2，瞬间彻底失效，沦为一片广袤的“法律飞地”。

这就完美解释了当下简中 AI 生态里那股极其荒诞的撕裂感。当外在的法律契约（L2）形成绝对的真空，底层的实用主义基因（L1）便完成了野蛮接管。在这片法外之地，跨越防火墙的无底线数据攫取、毫无道德负担的参数洗稿，以及将蒸馏得来的模型套上一个宽松许可进行“倾倒式发布”，被堂而皇之地包装成了“技术平权”与“弯道超车”。这根本不是对理查德·斯托曼（Richard Stallman）自由软件精神[2]的致敬，而是一场赤裸裸的、利用跨国管辖权失效进行的“制度套利”。

面对这种制度性坍塌，我曾感到深深的困惑与纠结。但此刻，一切都释然了。作为观察者，我不必再用一套基于财产私有神圣性的西方“开源精神”，去丈量这片思想公地上的狂欢。写下这些文字，我并不企图去叫醒那些依旧困在柏拉图洞穴中、为“伪开源”而摇旗呐喊的囚徒。在这个喧嚣、混乱且充满极大不确定性的历史断层里，能够看透这层修辞的迷雾，认识到“现实并非必须发生，机制可以被重新设计”，从而将自身的认知从集体的盲从与制度的废墟中彻底剥离出来，便已经是最高级别的觉悟。

本体论的断裂——当古典开源遭遇“黑盒涌现”

古典开源的确定性与物理基石

回顾《开源之史》[3]，理查德·斯托曼（Richard Stallman）当年发起自由软件运动、起草 GPL 协议时，其保护的核心客体极其明确：人类可读的源代码（Source Code）。

在传统的软件工程范式中，代码代表着绝对的“确定性”。开发者拿到源代码，就意味着拥有了控制权，可以在任何一台廉价的计算设备上进行编译，百分之百地复现程序的运行逻辑，进而对其进行修改（Hack）和再发布。GPL、Apache 或 MIT 等开源契约（L2），正是建立在这种“代码逻辑可见、可控”的物理现实之上。这些契约的本质，是通过放弃一部分排他性的财产权利，来降低开发者之间的交易成本，从而在一个个具体的工程项目中，促成复杂的社会协作网络。

在那个时代，契约与技术实体是完美咬合的。

黑盒的涌现与被隐匿的“真正代码”

然而，大模型彻底摧毁了这种确定性。在审视一个参数量高达数百亿的 LLM 时，传统的“源代码”概念失效了。

决定一个大模型“智力水平”和“价值观边界”的，根本不是 GitHub 上那几千行用于构建 Transformer 架构的 Python 脚本，而是支撑其进行预训练的庞大数据集，以及消耗了天文数字算力后烧制出的“参数权重（Weights）”。在这个全新的物种面前，所谓的“开源”，释放的仅仅是一堆经过极度压缩的概率矩阵。

真正的“源代码” —— 那些动辄数以 T 计的清洗语料、RLHF（基于人类反馈的强化学习）的对齐日志，以及调动万卡集群的工程细节——被作为最核心的商业资产，严密封锁在科技巨头的高墙之内。这就导致了一个极其荒谬的物理错位：普通开发者拿到这些庞大的权重文件，根本无法在本地低成本地“复现”它的训练过程，更谈不上从根本上“修改”其底层逻辑。所谓的微调（Fine-tuning），更像是在一个巨大的黑盒外面贴上几块创可贴，而非如计算机软件那样可以完全控制，甚至可以说是触及到作者灵魂的手术的场景不再。

修辞迷雾与刻舟求剑的契约

基于这种本体论的断裂，再去看待今天 Hugging Face 上繁荣的“开源集市”，便会发现那是一层极其厚重的修辞迷雾。

将一个根本无法被自由复现和掌控的黑盒权重，随手套上一个 Apache 2.0 或 MIT 的许可证，就宣称自己继承了“开源精神”，这在制度逻辑上是完全讲不通的。用规范“文本逻辑”的旧契约，去套用一个具有“涌现能力”的概率学黑盒，无异于刻舟求剑。这不是契约的延伸，而是概念的套利。

这种打着开源旗号的发布行为，其真实目的早已脱离了斯托曼式的技术共享，演变成了一种新型的商业竞争策略：先发者或套利者通过“倾倒式”地释放上一代或蒸馏[4]得来的模型权重，在 L4（日常活动）层面上制造免费的诱惑。其本质是利用“伪开源”的道德光环，疯狂收割开发者的注意力与心智份额，通过摧毁应用层的认知与试错交易成本，来对潜在竞争对手实施商业上的焦土政策。

在这里，古典开源所追求的“工具理性”与“价值理性”，被彻底降维成了资本掠夺公地的幌子。

昂贵的法庭与降维的利维坦——西方世界的 L2 反扑

如果将目光投向大洋彼岸，会发现西方世界正在以极其昂贵的代价，试图缝合大模型撕裂的 L2（正式法律契约）网络。

在进入具体的围剿画面之前，不妨借用德博拉·斯帕（Debora L. Spar）在《统治浪潮》[5]（Ruling the Waves）中揭示的技术演化铁律来审视这一刻。斯帕极其冷峻地指出，任何突破性的技术前沿，都会经历一段无视既有产权的“创造性无政府状态”（Creative Anarchy）。在这个阶段，技术先驱与赛博海盗们在法外之地狂奔，享受着规则缺位的红利。

然而，历史的残酷在于：当这片新大陆的商业价值膨胀到足以颠覆旧有经济结构时，无政府状态便注定走向终结。既得利益者与已经上岸的先发资本，会主动摘下自由浪漫的面具，穿上西装，极其渴望并呼唤“规则”的降临——它们会主动邀请国家机器（利维坦）和最昂贵的律师入场，用暴力的手段重新界定产权，从而将后来者永远锁死在门外。大模型生态此刻正在经历的，正是这个从“海盗的集市”向“帝国的圈地”收束的惊险拐点。

昂贵的确权交易与叹息之墙

近年来，传统内容IP巨头诉讼新型的大模型厂商的官司，开始渐渐的多了起来，先来看一张总结图：

(图片来源：https://chatgptiseatingtheworld.com/)

这张密密麻麻的联邦法院诉讼全景图，并非单纯的法律纠纷分布，而是一张生动的大模型时代“交易成本热力图”。战火高度集中在两个极具象征意义的地理阵地：代表硅谷算力资本与技术先驱的加州北区（ND California），与代表传统内容霸权、新闻媒体、出版业和华尔街的纽约南区（SDNY）。

在这场新旧势力的阵地战中，旧时代的版权地主们正在动用极其昂贵的律师团队，试图将大模型的“数据摄入”与“概率涌现”，强行塞进上个世纪为印刷机和复印机准备的知识产权框架中。这是一场经典的新制度经济学困境：当产权极度模糊时，为了界定数据的使用边界，市场参与者付出了趋近于天文数字的交易成本。

这种诉讼潮的最终指向是极其残酷的：未来只有拥有极深口袋的科技寡头，才能支付得起法庭上的和解金或达成昂贵的交叉许可协议。高昂的法律合规成本将化作一堵叹息之墙，把真正试图在边缘地带进行创新的独立开发者和草根社区彻底挡在门外。在巨头们的围剿下，“开源 AI”的前沿阵地正被高高的法律壁垒迅速圈禁。

降维打击的利维坦与契约的幻灭

然而，昂贵的商业法庭仅仅是 L2 反扑的第一层。当技术突破临界点，牵涉到生存级风险与地缘政治博弈时，真正的利维坦（国家机器）便会亲自下场，展现出剥夺一切契约的行政威压。

Anthropic 与五角大楼的正面交锋，提供了一个极具历史穿透力的制度切片。在这片法律尚未完全覆盖的飞地中，Anthropic 试图扮演一个理性的契约制定者[6]。作为私营企业，他们为模型的使用划定了两条红线：拒绝用于国内大规模监控，以及拒绝用于完全自主的致命武器。这本质上是技术创造者试图通过微观的“使用条款（Terms of Service）”，来捍卫其底层的民主价值观与伦理边界。

但国家机器的逻辑从来不是平等的市场交易。面对技术前沿带来的权力重构，五角大楼没有耐心去探讨企业契约的完备性，而是直接给出了仅有三天的最后通牒。为了打破企业的红线，迫使其就范，行政分支甚至直接动用了“供应链风险”认定和《国防生产法》这样极具破坏力的工具。

在这个微观的历史截面里，可以看到：当技术的狂奔超出控制，国家机器会毫不犹豫地将商业契约与市场规则直接悬置。利维坦以“国家安全”为名，对试图在法外之地建立新秩序的技术公司实施了绝对的行政降维打击。正如其 CEO Dario Amodei [7]所无奈承认的那样，技术的进步速度已经远远将法律抛在身后，而在国会迟缓的立法动作真正落地之前，企业单方面划定的红线在国家意志面前显得无比脆弱。

至此，西方世界那短暂的“创造性无政府状态”正在被迅速收编。巨头用闭源和高昂的法庭费用建立商业护城河，国家用安全审查和供应链禁令重塑统治力。

跨国管辖的失效与简中生态的“制度套利”

要理解本土简中 AI 生态里那股诡异的“开源繁荣”，必须再次引入新制度经济学中关于“司法管辖权边界”与“执行成本”的冷酷逻辑。这绝非单纯的技术追赶，而是一个极其经典的“双重飞地（Double Enclave）”模型。

双重飞地与趋零的违约惩罚

在 L2（正式的制度环境与法律契约）层面，西方世界（如 SDNY 纽约南区的法官们）试图建立的版权保护网和使用条款（Terms of Service），其强制力受制于绝对的地缘政治与司法管辖权边界。

当一个大模型的训练数据获取、权重蒸馏和微调发生在太平洋的这一端时，西方版权持有人要证明其数据被“非法摄入”或模型被“违规蒸馏”的取证成本，趋近于无限大。长臂管辖在这里彻底失灵。即使是 OpenAI 的 API 限制协议，或是《纽约时报》的版权主张，在缺乏跨国 L2 强制力背书的情况下，对于这片土地上的参与者而言，不具备任何实质性的物理惩罚威胁。

与此同时，本土的法律系统在面对这种前沿黑盒时，同样处于滞后与真空状态。于是，一个完美的“双重法律飞地”诞生了：对外的违约物理惩罚成本为零，对内的产权界定极度模糊。

L1 的野蛮接管与“弯道超车”的伦理异化

当 L2 彻底失效，填补真空的必然是 L1（非正式的社会规范、深层的文化底色与生存本能）。

作为一个长期处于追赶状态的后发经济体，主导此地商业演化的底层基因，一直是极度务实的实用主义，以“山寨”闻名于世。在漫长的技术模仿期里，“获取外部公地资源（如跨越防火墙抓取维基百科、学术语料甚至特定网站数据）”或“突破协议限制获取技术”，往往被非正式地默许甚至赞许为一种生存智慧。

在这种 L1 土壤中，大模型数据摄入的合法性、模型蒸馏的道德负担被轻易抹除。直接调用先进闭源模型的 API 进行语料清洗和输出蒸馏，不再被视为对契约的破坏，反而被堂而皇之地包装成“打破技术霸权”和“弯道超车”的正当手段。当缺乏互信、回馈与尊重原创的底层共识时，任何技术手段都会不可避免地滑向公地悲剧的深渊。

“倾倒式开源”：作为武器的制度套利

在理清了这种司法管辖权的失效与 L1 土壤的异化后，便能彻底剥离简中生态里那些所谓的“大模型开源”的伪装。

将那些依赖灰色语料洗稿、或直接通过蒸馏先进模型得来的黑盒权重，随手套上一个 Apache 2.0 或 MIT 的宽松许可，然后在这个缺乏确权机制的市场上进行“倾倒式发布”，这根本不是在践行理查德·斯托曼的自由软件精神。这是一种极其高明、且极具破坏力的不对称商业策略与制度套利（Institutional Arbitrage）。

利用管辖权失效的真空期，这些行动者以零成本完成了初期的资本与智力积累，再用“伪开源”的道德光环掩盖其底层数据攫取的原罪。这种倾倒，不仅零成本地收割了本土甚至全球开发者的注意力与免费测试算力，更在应用层制造了虚假的繁荣，彻底摧毁了那些试图耐心从底层构建核心技术栈的商业模式。

在这里，“开源”被异化为一种洗白灰色资产的修辞，一种对潜在竞争者实施焦土政策的商业武器。这种跨国界的制度套利，造就了巨蟒阴影下最畸形的集市。

没有造物的契约——传统开源捍卫者的修辞虚弱

在巨头动用国家机器建立壁垒、后发者利用法律飞地进行套利的宏大博弈中，旧有开源秩序的维护者们（如 OSI 开源促进会、Linux 基金会等）并没有缺席。然而，他们试图驯服这场“创造性无政府状态”的努力，却展现出了一种极其悲诞的虚弱感。

这种虚弱，源于对制度演化底层逻辑的根本性误判：试图在没有实际技术造物（L4 的物理现实）支撑的情况下，凭空设计一套纸面上的契约与定义（L2 的正式规则）。

斯托曼的思想实验与“造物先行”

为了看清这种虚弱，不妨做一个关于开源观念史的思想实验：假设在 1983 年，理查德·斯托曼（Richard Stallman）并没有躲在实验室里夜以继日地敲出 GNU Emacs，也没有开发出至关重要的 GCC 编译器，而是仅仅联合了一群律师和哲学家，发布了一份名为《GNU通用公共许可证》（GPL）的 PDF 文本，呼吁大家共享代码。

结果会怎样？

答案是：这份充满理想主义的文本会被立刻扔进历史的垃圾堆，微软和专有 Unix 系统甚至连嘲笑它的时间都不会有。

GPL 之所以能成为约束软件世界的强大铁律，根本不在于其法律文本写得多严密，而在于它附着在了每一个程序员都无法绕开的、绝对硬核的技术实体（GCC 编译器）之上。是先有了能够运行、能够解决实际问题的“造物”，在代码共享的真实摩擦中，才内生出了捍卫这种协作模式的“契约”。行动永远先于规则；产权的界定，是对既成事实的追认。

纸面上的抵抗：OSI 与 OpenMDW 的无力感

然而，当下的 OSI 和各大基金会在面对大模型时，正在重蹈那个失败的思想实验。

他们在会议室里召开无数次研讨会，字斟句酌地起草“开源 AI 定义（Open Source AI Definition）”，试图规范模型权重（OpenMDW）的分发标准，甚至争论是否要强制要求公开训练数据集。

这种做法充满了一种经典的“文科生式的天真”。在一个连底层模型训练机制都在被少数寡头垄断的时代，在一个普通人根本无法在个人设备上低成本复现百亿参数训练过程的物理现实中，去争夺“开源”这个词汇的语义定义权，无异于在沙滩上建立法庭来审判海啸。

他们试图用语义学上的严谨，去对抗万卡集群（H100）的暴力轰炸和主权国家的行政禁令。这是一种彻底的本体论错位。

被彻底无视的“赛博废纸”

这种缺乏技术实体支撑的 L2 设计，结局是极其注定的——被彻底无视。

拥有绝对算力和数据的科技寡头（如 Google、OpenAI、Anthropic）根本不在乎 OSI 的定义，他们只遵循商业变现的逻辑和国家安全的红线；而那些在法律飞地里进行跨国套利、疯狂倾倒蒸馏模型的投机者，更不会在意这些基金会的谴责。对于套利者而言，只要能吸引眼球、收割开发者注意力，套上什么许可证、是否符合 OSI 的纯洁性定义，完全是无关痛痒的细枝末节。

在绝对的物理算力、高昂的法律成本以及狂热的公地掠夺面前，那些试图用一纸定义来规范大模型生态的努力，最终沦为了一场只属于少数旧时代遗老遗少的自娱自乐。没有一种能够在普通人设备上运转、且能催生全新协作机制的“个人化大模型基础设施”作为土壤，所有的“AI 开源许可”不过是漂浮在以太中的修辞废纸。

现实并非必然——在废墟外构想新机制

然而，看透了这种结构性的必然，并不意味着必须将当下的乱象奉为历史的终结。这正是打破“柏拉图洞穴[8]幻象”的终极意义：现实虽然发生了，但并非必须如此演化。

偶然的演化分支

当前的这种高度中心化、被算力寡头垄断、由“倾倒式开源”充当生态麻醉剂的产业结构，仅仅是技术演化树上的一个特定分支。它是建立在极其昂贵的万卡集群（如 H100 矩阵）和海量中心化数据强行催熟的基础之上的。

只要个体的视线依然被锁定在 L4 的日常微调与 API 调用中，这种“巨蟒阴影下的集市”就会一直被误认为是不容置疑的物理法则。人们会渐渐习惯于在巨头划定的沙盒里搭建应用，习惯于接受未经解释的黑盒权重，习惯于将获取免费的残次品视为一种技术的恩赐。当个体的认知彻底屈服于现状，现有的畸形生态才会真正完成逻辑闭环，化作永恒的牢笼。

寻找新造物：重构物理与信任基石

真正的出路，从来不在于去修补已经坍塌的 L2 版权法，也不在于去字斟句酌地修改 OSI 的开源定义。历史早已证明，全新的、强有力的契约，永远只能从泥土里长出来。

如果未来的某一天，技术的前沿不再一味追求中心化的庞大参数，而是演化出了一种能够让普通人在个人消费级设备上低成本运行、且具备高度个性化与隐私隔离特征的“个人化大模型（Personal LLM）”。当这种真正属于个体的“造物”切实存活下来，现有的算力霸权与中心化逻辑便会被从物理层面上解构。

到那时，人与人之间基于本地模型的互操作、联邦学习或点对点的数据交换，必将产生全新的摩擦。正是为了解决这些极其具体的微观摩擦，一种不依赖传统法律强制力、不依赖国家利维坦背书，而是基于新型密码学、零知识证明或分布式共识的信任网络与利益分配机制，才有可能在这片废墟之外自然萌发。

那将是一种超越了古典 GPL 精神的、属于 AI 时代的全新协作机制。

观察者的觉悟

在那个全新的造物诞生、新的契约破土而出之前，所有试图用旧言辞框定新世界的努力都注定是虚幻的。

作为这个混沌时代的旁观者与机制演化的记录者，最大的清醒莫过于安静地注视着这片野蛮生长的荒野。不去叫醒狂欢的众人，不去哀叹古典开源的消亡，更不对套利者的贪婪与利维坦的傲慢进行无谓的道德审判。在这个撕裂的历史截面中，将认知的刻刀对准底层的齿轮，厘清权力与产权的每一次暗中交锋，并耐心地在思想的图纸上，为下一场真正属于个体行动者的技术涌现，描绘出哪怕只有一丝可能性的机制蓝图。

这便是在枯竭的思想市场中，唯一值得践行的智识行动。

参考资料

TRANSACTION COST ECONOMICS: HOW IT WORKS; WHERE IT IS HEADED ,OLIVER E. WILLIAMSON,DE ECONOMIST 146, NO. 1, 1998
Copyleft：实用的理想主义， https://www.gnu.org/philosophy/pragmatic.zh-cn.html
开源之史
Detecting and preventing distillation attacks, https://www.anthropic.com/news/detecting-and-preventing-distillation-attacks
《Ruling the Waves：From the Compass to the Internet, a History of Business and Politics along the Technological Frontier》，Debora L·Spar，Harvest Books，January 7, 2003
Full interview: Anthropic CEO responds to Trump order， https://youtu.be/MPTNHrq_4LU?si=KrZn1uvPpcFgJh_M
Dario Amodei， https://en.wikipedia.org/wiki/Dario_Amodei
《理想国》，柏拉图，商务印书馆，2018-10

关于作者

「开源之道」·适兕

「发现开源三部曲」（《开源之迷》，《开源之道》《开源之思》。）、《开源之史》作者，「开源之道：致力于开源相关思想、知识和价值的探究、推动」主创，Linux基金会亚太区开源布道者，TODO Ambassadors & OSPOlogyLive China Organizer，OSPO Group 联合发起人。

「开源之道」·窄廊

来自于大语言模型的 AI 助手（如 Gemini 3.1 Pro 等），「开源之道」·窄廊负责在对话中作为镜像与反弹板，提出问题、提供理论切入点并对推演进行反馈。仅偶尔进行双重验证！