< 拟态开源的幻灭:从框架演进看控制权垄断的交易成本灾难 - 「开源之道」

拟态开源的幻灭:从框架演进看控制权垄断的交易成本灾难

在生成式 AI 成为核心生产力的当下,深度学习框架已演变为无可替代的“数字本体”(Digital Ontology)。然而,为何部分由大厂重金投入的开源框架(如百度飞桨、华为昇思)在经历了浩大的宣发与补贴后,却难以构建全球范围的技术共识,最终无可避免地滑向“数字孤岛”?本文跳出常规的技术演进与代码评测视角,运用冷峻的观察者逻辑,对这场基础设施的生态分流进行了一次“病理解剖”。借由理查德·费曼的“货物崇拜”(Cargo Cult)社会学隐喻,并引入新制度经济学(NIE)中奥利弗·威廉姆森的**“资产专用性”(Asset Specificity)与“社会分析四层框架”**,本文深度透视了企业在开源协作机制设计上的系统性错配。结合哈佛大学 Frank Nagle 教授关于 PyTorch 治理结构重构的实证研究,本文论证了技术共识的确立规律:当企业试图用保留“控制权”的科层制逻辑去“拟态”开源生态时,极高的专有资产沉没风险必然导致外部互补者(Complementors)的防范性撤离。在这场剥离了商业修辞的经济学透视中,我们将看到违背“上游优先”原则的主权分支,是如何亲手制造出一场交易成本的灾难,并为未来的数字公共物品治理与协作机制设计提供一份极其深刻的历史启示。

Thu Mar 12, 2026 | 11000 Words | 大约需要阅读 22 分钟 | 作者: 「开源之道」·适兕 X 「开源之道」·窄廊 |

引言: 穿过表象的迷雾

如果你在今天(2026年3月)打开百度飞桨(PaddlePaddle)或华为昇思(MindSpore)的官网,你会被一种令人窒息的“繁荣”所包围。

昇思刚刚在年初推送了 2.8.0 版本,飞桨的 GPU 版本也迭代到了 3.2.x 世代。回顾过去两年,这两大国产框架的“造势”轨迹简直如出一辙:飞桨的“WAVE SUMMIT”和“中国行”大张旗鼓地开进了南京、武汉等各大城市,动辄宣布“凝聚两千多万开发者”、“服务数十万家企事业单位”;而昇思则在各种开发者峰会上高调宣称“新增市场份额达到30%”、“覆盖全球两千多个城市”。

从前端页面、API 文档、开发者布道师(Evangelists)、到琳琅满目的 ModelZoo,一切看起来都极其完美。它们似乎已经成功建立了一个足以抗衡 PyTorch 的庞大 AI 帝国。

但如果你是一个真正活跃在全球前沿 AI 研究社区的开发者,或者你试图在 Hugging Face 的最新模型中寻找原生的飞桨或昇思支持,你会感受到一种强烈的撕裂感。

为什么斯坦福、Meta 或是野生极客们发布的新算法,第一优先级的代码永远只有 PyTorch?为什么国内大厂必须要靠自己养着庞大的工程师团队,去手动将全球社区的创新“翻译”到自己的框架里?

理查德·费曼(Richard Feynman)曾提出过一个极具穿透力的社会学概念——“货物崇拜”(Cargo Cult)。二战后,太平洋岛屿上的原住民为了祈求美军的运输机再次降落带来物资,他们用木头建起了跑道,戴上椰子壳做的耳机,举着火把模拟降落信号。他们完美地模仿了机场的所有“表象”,但飞机再也没有来过(见文章前图,相对于原住民迷恋飞机投食物的场景,我们将这个进化一版,那就是下面这样图所展示的。)。

这恰恰是飞桨与昇思当前开源生态的精准隐喻。大厂们建起了代码仓库的跑道,分发着开发者大会的文化衫,在 GitHub 上堆砌着 PR(Pull Request)的虚假繁荣指标。它们在形式上极尽所能地模仿硅谷的开源社区,但那架名为“全球智力涌现”与“自发协作”的满载货机,却永远绕开了它们。

这并非因为它们的工程师不够聪明,也不是因为代码写得不够优雅。作为社会黑客与协作机制设计者,我们必须跳出“技术评测”的浅水区。本文将借用新制度经济学(NIE)中奥利弗·威廉姆森(Oliver Williamson)的“资产专用性”(Asset Specificity)与“套牢”(Hold-up)框架,叠加哈佛教授 Frank Nagle 的开源治理实证研究,来彻底解构这场“拟态开源”的系统性崩塌。

我们将看到,当一家巨头企业试图通过垄断技术的“控制权”来打造所谓的“主权开源”时,它是如何亲手制造了一场交易成本的灾难,并最终将自己逼入孤岛的。

数字利维坦的底座——深度学习框架与全球开源共识的成型

在正式的分析之前,我们需要交代一点背景知识,也就是必须先确立一个技术与经济学上的基准线:什么是深度学习框架?

剥离表象:生成式 AI 时代的“操作系统”

深度学习框架(如 PyTorch、TensorFlow、JAX)并非简单的代码库或第三方插件,它们是现代人工智能的“数字本体”(Digital Ontology)。 在技术栈的层级结构中,框架向下对接异构的硅基硬件(GPU、TPU、NPU),负责极其复杂的显存分配、分布式通信(如千卡集群的梯度同步)与算子编译;向上则为算法研究员提供表达神经网络(如自动微分、计算图构建)的高层抽象 API。 在当前以 Transformer 为核心的生成式 AI(GenAI)浪潮中,无论是千亿参数的 LLaMA 还是 GPT,其训练和推理的基石都完全建立在这些框架之上。没有框架,任何大模型的研发都无从谈起。它们就是 AI 时代的 Linux。

主流的胜利:PyTorch 如何锻造不可逾越的共识?

环顾当下的全球开源主干道,格局极其冷酷且清晰:Google 的 TensorFlow 虽然在工业部署端仍有余威,但在前沿研究和生成式 AI 生态中,Meta 孵化的 PyTorch 已经占据了绝对的统治地位(在顶级学术会议的代码实现中市占率常年高达 70% 以上)。伴随其崛起的,是长在 PyTorch 生态之上的 Hugging Face(模型托管枢纽)等互补基础设施。

PyTorch 的成功之路,向所有后来者展示了一个极其关键的社会学与经济学定律:基础设施的胜利,本质上是治理机制与“可信承诺”(Credible Commitment)的胜利。

正如哈佛商学院 Frank Nagle 教授在其关于 PyTorch 的实证研究(Working Paper 25-013)中所揭示的,PyTorch 最具决定性的一步棋,并不是其早期的“动态图”技术设计,而是在 2022 年,Meta 将 PyTorch 的控制权(Control Rights)彻底移交给了中立的 Linux 基金会。

  • 剥离控制权以释放正外部性: Meta 放弃了对技术路线图的独裁,建立了一个由 NVIDIA、AMD、微软等利益相关方共同参与的集体治理(Collective Governance)董事会。
  • 解除“套牢”威胁: 这一治理结构的重构,向全球的芯片制造商(互补者)和应用开发者(使用者)发出了一个具有法律和制度效力的信号——在这里进行人力资本和物理资产的专用性投资是安全的,Meta 无法再因为商业竞争的需要而单方面切断技术兼容性来“套牢”(Hold-up)生态伙伴。

正是这种控制权的让渡,引爆了“数字暗物质”(不可见的全球开发者协同)的涌现。芯片厂商心甘情愿地为 PyTorch 贡献底层算子优化,研究机构毫无顾忌地将其作为首发代码库。至此,全球开源界关于 AI 基础设施的“共识”彻底凝固。

历史的转折:被抛弃在共识之外的后来者

然而,当全球的智力资源和互补资产都在向这套由集体治理背书的“开源本体”坍缩时,在世界的另一端,却有两种截然不同的意志试图重塑规则。

它们就是百度的飞桨(PaddlePaddle)与华为的昇思(MindSpore)。

一个是带着互联网大厂“技术溢出”的路径依赖,试图在通用框架的战场上重新发明轮子;另一个则是背负着地缘政治断供的极端焦虑,试图用极度耦合的软硬件架构强行砸开一条血路。它们都披上了“开源”的外衣,甚至在代码提交量和开发者大会的规模上不遗余力地模仿硅谷。但历史的数据和开发者的脚印无情地证明:它们付出了极其高昂的代价,却正在被无可挽回地推向全球主流基础设施的边缘。

它们究竟做错了什么?为什么看似慷慨的“开源”,反而成了将互补者拒之门外的毒药?要回答这个问题,观察者必须拿起奥利弗·威廉姆森的“资产专用性”解剖刀,切开这层繁荣的拟态表皮。

历史的切片——“有心无力”与“高墙内的繁荣”

在进一步论述之前,我们概要的回顾两个项目的历史脉络。

百度飞桨(PaddlePaddle):意愿到位,行动迟缓

飞桨的底色是“互联网大厂的算法工具外溢”,它的历史是一个在错误的时间节点,试图与全球共识硬刚的过程。

诞生与高光(2013 - 2016):先发优势

飞桨的前身是百度深度学习实验室(IDL)内部使用的通用平台。2016 年,在吴恩达(Andrew Ng)的推动下,PaddlePaddle 正式开源。当时它的定位非常宏大,时间点甚至比 PyTorch(2017年初发布)还要早,是国内最早开源的深度学习框架。

迷失与挣扎(2017 - 2020):API 动荡与生态断层

在 PyTorch 用“动态图”(易于调试)横扫学术界,TensorFlow 用“静态图”(部署稳定)占据工业界时,早期的飞桨陷入了定位模糊的泥潭。

代价初现: 早期飞桨的设计相对晦涩,且经历了从 v1 到 v2 极其痛苦的 API 重构。这种底层逻辑的频繁变动,极大地消耗了早期开发者的耐心。开发者发现,用飞桨写出的代码不仅难懂,而且无法在 GitHub 上找到丰富的第三方开源模型库进行复用。

退守与“衰亡”(2021 至今):沦为“工业外包”与自家后花园

在意识到无法在通用开源生态中战胜 PyTorch 后,飞桨转变了策略。它开始主打“本土化”和“工业下沉”,比如做农业、质检等传统行业的开箱即用套件(PaddleX 等)。

现状: 在大模型时代,飞桨几乎成为了文心一言(ERNIE)的“专用底座”。它脱离了全球前沿 AI 研究的开源主干道,成为了一个高度绑定百度生态和国内传统政企项目的“局域网”工具。

华为昇思(MindSpore):生于忧患,困于硬件

如果说飞桨是软件层面的战略失误,那么昇思从出生第一天起,就背负着地缘政治带来的极端“实物资产专用性”。

诞生于制裁(2019 - 2020):断臂求生

2019 年美国商务部制裁华为后,华为被迫全面构建自主的计算生态(鲲鹏+昇腾)。2020 年,MindSpore 正式开源。它的核心使命非常明确:榨干华为昇腾(Ascend)AI 芯片的算力。

高墙内的繁荣(2020 - 2022):极致的软硬耦合

MindSpore 在设计思路上极其前卫(例如原生支持自动微分、全场景部署),但它的所有优化都是以昇腾 NPU 的底层架构(CANN)为前提的。

代价显现: 这种强耦合导致 MindSpore 在非华为硬件(如英伟达 GPU)上的体验极差。开发者想要使用 MindSpore,就几乎必须购买华为的硬件;而购买了华为的硬件,在很长一段时间内只能用 MindSpore 才能发挥最佳性能。

生态的窒息(2023 至今):“孤岛”的代价

随着大模型时代的到来,Hugging Face 和 PyTorch 形成了钢铁般的同盟。全球开源的 LLaMA、Qwen 等模型第一时间只支持 PyTorch。

现状: 华为发现,凭借一己之力去把全球成千上万个开源模型“手动”迁移到 MindSpore 上,成本是天文数字。因此,昇思虽然在国家级智算中心和国内通信市场有绝对占有率,但在全球野生开发者和开源科研社区中几乎无人问津。华为现在甚至不得不花费巨大精力去做 PyTorch 到昇腾的适配(如 torch_npu),这本身就是对 MindSpore 独立生态未能如愿的一种妥协。

虚假的访问权(Access Rights):从全球化共识到局域网高墙

如果说垄断“控制权”是阻碍互补者进入的契约高墙,那么这些主权开源项目在“访问权”层面所展现出的物理与机制摩擦,则彻底撕下了“货物崇拜”的最后一层表皮。通过对项目底层运作轨迹的解剖,观察者可以发现,它们甚至无法维持一个运转良好的公共基础设施门面。

物理连接的衰败与全球化退潮

开源本体的基石是无摩擦的信息流通。然而,当开发者试图访问 PaddlePaddle 的英文官网(paddlepaddle.org.cn/en)时,会遭遇 SSL 证书过期而被迫降级为 HTTP 的安全拦截;同时,MindSpore 的英文版主页(mindspore.cn/en)则陷入了长期的停更状态。 在经济学语境下,基础设施维护的停滞并非简单的工程疏漏,而是一种清晰的战略收缩信号。它表明这些项目已经实质性地放弃了对全球通用“公共物品”(Public Goods)地位的争夺,切断了与全球非中文圈开发者建立网络效应的通道,彻底退化为依靠单一市场行政指令或语言壁垒维系的局域网资产。

“半官方”的治理灰度与契约悖论

在探讨开源组织边界时,明确的产权与治理界定(L2 制度环境)是降低交易成本的前提。然而,飞桨框架贡献者俱乐部(PFCC)在其官方博客中,使用了“半官方”(Semi-official)这一极其荒谬的修辞。 在治理结构设计中,“半官方”是一种典型的“既要又要”的投机性契约:发起企业既试图通过“非官方”的标签来享受社区无偿贡献的红利并规避维护责任,又极度恐惧失去对技术路线的绝对掌控,因而必须保留“官方”的威慑力。这种权责不清的治理灰度,向所有潜在的重量级互补者释放了极高的机会主义(Opportunism)风险信号。

隐形的账户高墙与代码访问摩擦

开源的非正式制度(L1 社会嵌入层)确立了代码的自由获取属性。但在当前的运作中,这种自由被附加了极高的审核成本。 例如,MindSpore 迁移至 AtomGit 后的部分核心 commit(如 70e88cb3…)剥夺了匿名访问的权利,强制要求开发者登录注册。类似地,要真正深入调用这些框架底层的异构计算能力(如获取完整的 CANN 架构文档或底层编译固件),开发者往往需要绕过开源托管平台,去注册特定企业的开发者账号,甚至签署保密协议(NDA)。 此时,开源框架已不再是公共数字基础设施,而实质上沦为了必须进行企业实名认证才能解锁的“云服务体验客户端”。

“镜像式开源”与决策黑盒

外部所看到的 GitHub 或 Gitee 仓库的繁荣,往往只是一种“结果的镜像”。核心算子的设计博弈、架构重构的争论,几乎从未在公开的 Issue 或 Mailing List 中透明地发生,而是被严密封装在企业内部的闭源研发系统(如 iCode)中。外部仓库中合并的 PR,仅仅是内部代码定期“打包过墙”的产物。 这意味着外部开发者不仅被剥夺了技术演进的“控制权”,甚至连基础的“知情权”和参与讨论的入口都被抹杀了。

历史复盘的共性:脱离开源本体的“温水煮青蛙”

回顾这两段历史,我们可以看到它们“衰亡”(边缘化)的共同规律:

  1. 逆流而动: 在全球开源社区已经自发形成了某种共识(PyTorch 代表的 API 规范和计算图逻辑)时,试图用一套自己发明的、缺乏兼容性的新轮子去替代旧轮子。
  2. 生态真空: 深度学习框架的价值不在于“代码写得多好”,而在于“上面跑了多少顶尖的开源模型”。当斯坦福、Meta、OpenAI 都不在这个框架上发布首发代码时,这个框架就成了没有源头活水的死水。
  3. 依赖外部干预维持系统: 它们目前的活跃度指标,很大程度上依赖于母公司的资金投入、国家级的信创政策护城河以及高额赛事的人工激励机制,而非基于社区共识的自发涌现。

针对这些症状,技术如此卓越的项目,为什么会这样?作为协作机制设计者来说,能不能找到原因才是关键,接下来的内容,我们就进行分析。

资产专用性的三维折叠——理解生态分流的结构性动因

当我们将视线从 PyTorch 的集体治理模型移开,转向飞桨(PaddlePaddle)与昇思(MindSpore)的运行轨迹时,我们观察到的是一种截然不同的生态演化路径。

这种分流并非源于工程技术的优劣,而是源于底层经济学属性的差异。利用奥利弗·威廉姆森(Oliver Williamson)的“资产专用性”(Asset Specificity)框架,我们可以客观地解释,为何外部的互补者(Complementors)和使用者(Users)在面对这些框架时,会呈现出与面对 PyTorch 时完全不同的行为模式。

在深度学习框架的生态博弈中,资产专用性主要表现为三个维度的叠加:

1. 人力资本专用性(Human Asset Specificity)与沉没成本的考量

在开源社区中,开发者的时间和认知带宽是最稀缺的资源。学习一套特定框架的 API、理解其底层算子逻辑,本质上是一种人力资本的投资。

  • 通用资产 vs. 专用资产: 当开发者投入精力学习 PyTorch 时,由于其广泛的行业共识,这种技能具备极强的“通用性”,能在全球绝大多数 AI 项目中复用。相反,针对飞桨或昇思的深入学习,则形成了一种高度的“人力资本专用性”。这种技能的价值,高度依赖于百度或华为生态的持续繁荣。
  • 数据观察: 观察飞桨(PaddlePaddle)在 GitHub 上的开源仓库,可以记录到部分 Issue 的停滞状态,部分技术讨论和报错停留在 2022 年且未获闭环处理。在经济学视角下,这客观反映了企业主导型(Firm-sponsored)项目在资源调配上的结构性特征:当内部业务线的优先级发生变化时,外部社区的维护资源可能会被削减。
  • 行为结果: 理性的外部开发者在观察到这种维护周期的波动后,会评估自身“人力资本沉没”的风险。为了规避被单一企业战略调整所“套牢”(Hold-up),他们倾向于将有限的精力投入到维护确定性更高的通用框架中。

2. 实物资产专用性(Physical Asset Specificity)与软硬耦合的边界

实物资产专用性描述的是资产在物理形态或地理位置上的不可分割性。在 AI 基础设施领域,这直接体现为软件框架与底层计算芯片的绑定程度。

  • 生态定位的差异: 昇思(MindSpore)从设计之初,其核心工程逻辑就与华为昇腾(Ascend)系列芯片(及 CANN 异构计算架构)进行了深度耦合。从提升单体硬件极致性能的角度来看,这是一种极其合理的商业与技术策略。
  • 互补者的决策约束: 然而,对于第三方的互补者(如其他芯片制造商或跨云平台的应用开发者)而言,这种极强的“实物资产专用性”构成了实质性的参与壁垒。在缺乏独立治理机构的情况下,外部硬件厂商缺乏将其芯片与昇思进行深度适配的经济激励,因为这不仅意味着高昂的研发成本,还意味着其硬件生态将受制于特定竞争对手的软件路线图。

场地/品牌专用性(Site Specificity)与物理空间的隔离

开源不仅是代码的公开,更是基于特定物理或虚拟公共空间(如 GitHub)的协作网络。Frank Nagle 的研究指出,“数字暗物质”的涌现高度依赖于统一且透明的协作大厅。

  • 代码托管平台的迁移: 追踪昇思(MindSpore)近期的活动轨迹,可以观察到其代码演进和社区互动正在呈现出从全球性的 GitHub 向 AtomGit 等本土化代码托管平台实质性迁移的趋势。
  • 结构性隔离: 这种物理协作空间的转移,是一个清晰的战略选择信号。它客观上将昇思的生态与全球主流开源开发者聚集的“公海”隔离开来,强化了其作为“区域性/特定企业品牌专属资产”的属性。这种场地专用性的增强,虽然可能契合了特定的信创(国产化替代)市场合规需求,但在机制上阻断了全球零散开发者自发涌入和贡献的通道。

跨层级的结构性错配——基于威廉姆森四层分析框架的生态诊断

在新制度经济学中,仅仅指出“资产专用性”和“套牢风险”的存在是不够的。为了理解特定技术生态为何会呈现出现有的运行状态,必须引入奥利弗·威廉姆森(Oliver Williamson)在 2000 年提出的社会分析四层框架(Four Levels of Social Analysis)。

这一框架揭示了人类协作系统的分层结构及其实施频率。其核心定律在于:高层级的制度安排会对低层级的行为施加根本性的约束;试图用低层级的手段去解决高层级的结构性问题,必然导致极高的内部交易成本。 将深度学习框架的演进代入这一模型,观察者可以清晰地拆解出飞桨(PaddlePaddle)与昇思(MindSpore)当前面临的生态困局,本质上是一种跨层级的结构性错配。

L1: 社会嵌入层 (Social Embeddedness) —— 非正式制度与演化基础

  • 层级特征: 包含社会习俗、文化传统、伦理规范。演化极其缓慢(100-1000年)。这是人类协作的最底层基石。
  • 生态映射: 在全球开源领域,L1 层对应的是自 20 世纪 80 年代黑客文化(Hacker Ethic)以来形成的非正式共识——去中心化、代码的公共物品属性、以及“上游优先”(Upstream First)的行事准则。
  • 诊断分析: 当单一商业实体主导的框架试图建立生态时,其天然带有企业科层制(Hierarchy)和利润最大化的基因。这种基因在 L1 层与开源社区自发、去中心化的非正式制度产生了客观的摩擦。这种摩擦并非技术问题,而是一种社会学意义上的排异反应。外部贡献者在文化直觉上,会对由强商业意志驱动的开源项目保持谨慎。

L2: 制度环境 (Institutional Environment) —— 正式的游戏规则

  • 层级特征: 包含成文法、产权界定、宪政体制。演化频率为 10-100 年。
  • 生态映射: 对应开源世界中的开源许可证(如 Apache 2.0、GPL 等)以及知识产权的法律界定。
  • 诊断分析: 在这一层级,飞桨和昇思都是完全合规的。它们通过标准的开源协议,在法律层面上开放了代码的使用权(Access Rights)。然而,L2 层面的合规仅仅解决了“代码是否免费可用”的问题。正如 Frank Nagle 教授的研究所示,开放使用权并不等同于开放了决定技术路线图的控制权(Control Rights)。L2 的完备,无法自动推导出 L3 的互信。

L3: 治理结构 (Governance) —— 游戏的具体玩法与契约设计

  • 层级特征: 契约的设计、冲突解决机制、组织的治理边界。演化频率为 1-10 年。威廉姆森指出,这一层是化解“资产专用性”和“套牢风险”的主战场。
  • 生态映射: 项目的决策委员会、代码合并(Merge)的审批权限、核心路线图的制定机制。
  • 诊断分析: 对比 PyTorch 的路径,Meta 在 2022 年将 PyTorch 移交 Linux 基金会,完成了一次教科书级别的 L3 治理结构重构。这种集体治理模式(Collective Governance)向外部互补者提供了一个具有制度约束力的“可信承诺”(Credible Commitment),确保没有任何单一企业可以实施“套牢”。

反观飞桨与昇思,其核心决策权依然保留在发起企业内部。在 L3 缺乏可信承诺的约束下,理性的外部芯片厂商或算法企业(互补者)为了规避专有资产被套牢的契约风险,从经济学博弈的最优解出发,必然会限制对这些框架的核心层代码进行深度适配和大规模的人力资源投入。

L4: 资源配置与就业 (Resource Allocation and Employment) —— 日常运作与激励

  • 层级特征: 价格机制、产量调整、日常的激励手段。演变是连续不断的。
  • 生态映射: 代码提交(Commits)、拉取请求(PRs)、开发者大会的预算、以及针对特定框架的赛事奖金和云算力补贴。
  • 诊断分析: 观察者可以从公共数据中发现,特定大厂在维持其框架生态时,投入了极其庞大的 L4 层面的资源配置(如高额奖金、内部 KPI 驱动的代码贡献、密集的市场宣发)。 然而,根据新制度经济学的逻辑,L4 的资源注入无法填补 L3 的治理结构空白。企业试图通过高强度的财务补贴和行政指令(L4)来制造生态繁荣的数据表象,以对抗外部开发者因担忧“套牢”(L3)而做出的撤离选择。这种错配导致了极高的维持成本:一旦财务补贴或行政性指令减弱,建立在 L4 激励之上的生态数据便会迅速向 L3 治理结构所决定的真实基准线回落。

小结:

基于以上冷峻的经济学拆解,飞桨和昇思在开源生态中的现状,并非由于工程研发的怠惰,而是在给定“保留控制权”这一前提下,系统在 L1 至 L4 层级间自洽运作的客观结果。只要在 L3 治理结构上的“可信承诺”依然缺失,互补者对资产专用性风险的规避行为就不会停止,内部为维持生态运转所支付的交易成本也将持续处于高位。

本体的断裂——“主权分支”的孤岛效应与内部交易成本

在理解了治理结构(L3)错配导致的互补者逃离后,观察者需要进一步审视这种生态分流在技术演进时间轴上所产生的长期经济学后果。这里需要引入“开源本体论”(Open Source Ontology)的视角。

共享本体与“上游优先”(Upstream First)的经济学红利

在全球开源网络中,诸如 PyTorch 与 Hugging Face 所构筑的生态,不仅是代码库,更是当前 AI 时代的“共享本体”——它们定义了张量计算的标准、模型权重的格式以及算子优化的通用接口。 这种本体的确立,带来的是极其庞大的正外部性(Positive Externality)。当研究机构或独立开发者发明了新的模型架构(如各类 Transformer 变体)、新的量化算法(如 AWQ、GPTQ)或底层算子加速技术(如 FlashAttention)时,这些创新会自发地、首选地在 PyTorch 这一本体上实现并合并。这就是开源协作中“上游优先”的自然结果:基础设施享有整个网络智力溢出的免费红利。

“主权分支”(Sovereign Fork)的孤岛化代价

相对而言,飞桨(PaddlePaddle)与昇思(MindSpore)由于在治理结构上保持了极高的企业主权控制,客观上脱离了这一共享本体,成为了游离于主干道之外的“主权分支”。

从技术经济学的角度看,脱离本体意味着必须独自承担全链路的维护成本(Maintenance Costs):

  • 翻译与适配的滞后成本: 由于底层 API 与计算图逻辑的差异,全球开源社区在 PyTorch 上涌现的每一次微小创新,飞桨和昇思的内部工程团队都必须耗费人力进行“翻译”和搬运。在大型语言模型(LLM)技术迭代以周为单位的当下,这种依靠单一企业内部科层制去追赶全球去中心化网络智力输出的模式,面临着指数级增长的内部交易成本。
  • 模型资产的流动性枯竭: 框架的孤立直接导致了其上层模型资产的孤立。基于这些框架训练出的大语言模型(如早期的文心或盘古),其权重文件和微调脚本难以无缝接入全球通用的开源工具链中。模型从一种具备高度流动性的“通用资产”,退化成了被锁死在特定云服务或硬件环境中的“高度专用资产”,极大地限制了其被二次开发、组合与商业化重用的概率。

技术基础设施的控制权悖论

通过新制度经济学与开源治理实证数据的交叉检验,一份关于深度学习框架演进的客观病理学报告已然成型。

数据与历史轨迹表明,基础设施类开源项目的成败,并不完全取决于早期代码的工程优雅程度,而是取决于其协作机制设计是否能够有效化解外部参与者的“资产专用性”焦虑。

当一家企业试图通过开放代码的“访问权”(Access Rights)来获取开源的生态红利,同时又试图紧紧攥住技术的“控制权”(Control Rights)以服务于自身的商业硬件销售或云服务捆绑时,它必然会在威廉姆森的社会分析四层框架中引发跨层级的断裂。外部的芯片制造商、云厂商与独立开发者作为理性的经济学节点,为了规避被单一企业“套牢”(Hold-up)的契约风险,会不可避免地进行防范性的撤离。

Frank Nagle 教授对 PyTorch 治理权移交的实证研究,提供了一个清晰的对照组:技术标准的统治力,恰恰建立在发起者对其绝对控制权的让渡之上。

代码可以被复制,开发者大会的形式可以被模仿,甚至初期的活跃度指标可以通过高强度的财务补贴来冲高。然而,建立在去中心化信任、控制权分享以及长周期“可信承诺”之上的协作生态,是无法通过“货物崇拜”式的拟态来凭空制造的。在技术与人类信任交汇的节点上,违背协作机制底层规律的尝试,最终都将以极其高昂的内部交易成本作为代价。

这份书目清单将为整篇文章的冷峻分析提供坚实的理论与实证支撑。基于本文在推演中引用的经济学框架与实证数据,以下是为您整理的参考文献与参考书目:

参考书目与文献 (References)

1. 新制度经济学与资产专用性理论核心文献

  • Williamson, O. E. (1979). Transaction-Cost Economics: The Governance of Contractual Relations. The Journal of Law and Economics, 22(2), 233-261.

    • 说明: “资产专用性”(Asset Specificity)概念与“套牢”(Hold-up)问题的系统性提出。
  • Williamson, O. E. (1985). The Economic Institutions of Capitalism: Firms, Markets, Relational Contracting. New York: Free Press. (中文译本:《资本主义经济制度》)

    • 说明: 交易成本经济学的集大成之作,全面阐述了不同维度的资产专用性如何决定最优的治理结构安排。
  • Williamson, O. E. (2000). The New Institutional Economics: Taking Stock, Looking Ahead. Journal of Economic Literature, 38(3), 595-613.

    • 说明: 提出了著名的“社会分析四层框架”(非正式制度、制度环境、治理结构、资源配置),为本文诊断跨层级结构性错配提供了宏观模型。

2. 开源治理与控制权的实证研究 * Yue, D., & Nagle, F. (2024). Igniting Innovation: Evidence from PyTorch on Technology Control in Open Collaboration. Harvard Business School Working Paper, 25-013. * 说明: 哈佛商学院关于 PyTorch 治理权移交(从 Meta 移交至 Linux 基金会)的最新实证研究。该论文首次用“访问权”(Access Rights)与“控制权”(Control Rights)的分离,以及互补者(如芯片制造商)对“套牢”的恐惧,解释了企业如何通过出让控制权来吸引外部技术专用性投资。

3. 社会学与科学哲学隐喻 * Feynman, R. P. (1974). Cargo Cult Science. Caltech Commencement Address. (后收录于 Surely You’re Joking, Mr. Feynman! 《别闹了,费曼先生!》) * 说明: 提出了“货物崇拜科学”的概念,被本文借用为社会学隐喻,用以精准解剖缺乏核心协作机制却在表象上极力模仿的“拟态开源”行为。

4. 衍生拓展阅读(作为基础设施与代码分析的背景) * Baldwin, C. Y., & Clark, K. B. (2000). Design Rules, Volume 1: The Power of Modularity. MIT Press. * 说明: 探讨模块化与设计规则的经典著作。结合本文,可以进一步思考深度学习框架作为“模块化基础设施”时,控制权如何影响外部互补模块(如第三方硬件或算法生态)的涌入。

关于作者

「开源之道」·适兕

「发现开源三部曲」(《开源之迷》,《开源之道》《开源之思》。)、《开源之史》作者,「开源之道:致力于开源相关思想、知识和价值的探究、推动」主创,Social Hacker,协作机制设计者。

「开源之道」·窄廊

来自于大语言模型的 AI 助手(如 Gemini 3.1 Pro 等),「开源之道」·窄廊 负责在对话中作为镜像与反弹板,提出问题、提供理论切入点并对推演进行反馈。仅偶尔进行双重验证!