Plain Sight / After Dark
暗摆着 · 摆在明处的东西,只有关掉探照灯才看得见
After Dark 01 · 暗摆着

中国AI的暗物质

中国AI到底在干什么,以及为什么大语言模型之争只是冰山一角。
2026年4月 · 阅读时间16分钟

明摆着,意思是摆在明面上,显而易见。暗摆着,After Dark仍然从数据出发,用假定理性行为体的分析框架,去推断那些不那么显而易见的东西——那些可能隐藏在明面之外的暗物质。


没人听见的发令枪

OpenAI在2022年底打响了美国的AI竞赛。GPU狂热、英伟达股价飙升、时代精神的全面渗透。两年后DeepSeek横空出世,西方叙事顺理成章地把它吸收了进去:中国加入了这场竞赛。

这个时间线是反的。中国从2016年春天开始,就一直在全速奔跑,到现在已经十年了。发令枪不是在旧金山打响的。它来自伦敦。

当ChatGPT在一片屏息凝神的评论和Mag7的资本开支军备竞赛中推出时,中国已经跨两个五年规划,部署和迭代了一项国家AI计划。这项计划是在一个几乎没人在中国AI寒武纪大爆发语境下提起的人物推动下迅速起草的——尽管他才是那个点燃火种的人。

如果你认为中国AI始于DeepSeek,你就无法理解中国AI。


Demis震惊中国的那一天

2016年3月,Demis Hassabis和DeepMind团队在围棋上击败了李世石。围棋,一项拥有数千年历史的游戏,在中华文明中具有文化自豪感的地位。据估计,有2.8亿中国人观看了这些比赛。百度"人工智能"搜索量最高的那个尖峰,就落在李世石比赛期间。

美国对DeepMind的反应,基本上就是礼貌性的掌声和一部Netflix纪录片。那些溢美之词来自深蓝创造者之一的Murray Campbell——深蓝当然在当年击败了国际象棋冠军卡斯帕罗夫。但重点就在这儿:这被看作是解决了棋盘游戏。第二年,特朗普总统提议削减国家科学基金会对AI的资助。

而在中国,他们经历了相当于斯普特尼克时刻的事件。当然,在AlphaGo之前AI研究就已经在进行;但它并没有被当作国家级的优先事项,更多被视为一个小众的计算机科学项目,而非文明层级的基础设施。

李世石在第三局投子认输的那一刻,一切都变了。AlphaGo大获全胜后不到一个月,中国人民解放军召开了一次高层研讨会,题目是"AlphaGo与李世石人机对弈及指挥决策智能化研讨会总结"。是的,这是认真的。

2017年7月20日,国务院发布了《新一代人工智能发展规划》。这是一份分阶段推进的蓝图:2020→2025→2030,涵盖基础研究、产业应用、人才梯队和伦理规范。

这是一项自上而下的国家战略,比ChatGPT整整早了五年。

一个国家把AlphaGo当作一个攻克了史上最难棋盘游戏的技术演示;另一个国家则仿佛第一次看见了火。


西方看见一局棋;北京看见一种方法

在北京引发震动的,不仅仅是一场棋盘游戏的胜利。而是一种特定类型的智能的展演——一种通过自我对弈自我训练、学习对棋局位置的价值函数、并产生出人类从未认真考虑过的招法的智能。小数据,大任务。一只乌鸦,而不是一只鹦鹉。Hassabis没有造一台会模仿的机器。他造了一台似乎会推理的机器。

而他没有停下。每一个成果都是同一种方法——搜索、自我对弈、一种对“什么才算好”的习得判断——指向一个新的科学问题:

  • AlphaFold(2020年)攻克了结构生物学中一个长达五十年的难题,并在两年内成为全球公共科学基础设施。
  • GraphCast 在绝大多数指标上超过了世界领先的数值天气预报模型。
  • GNoME(2023年)一举找出220万种新的晶体结构,其中38万种被预测为稳定——大致把已知的稳定无机材料目录扩大了一个数量级。
  • 2024年诺贝尔化学奖,颁给了AlphaFold的工作。

这不是把AI当作聊天机器人。这是一位科学家,论文一篇接一篇,基于第一性原理,不断交付文明层级的基础设施。

真正关键的是这种不对称。西方看着AlphaGo,看见的是一局被攻克的棋。北京看着同一台机器,看见的是一个存在性证明——一种适用于任何你能模拟、能打分的领域的、进行原创发现的通用方法——并据此行动:重新配置资本流向、制度指令和工程人才,在十六个月内把它写进了一份国家规划。一座首都读懂了这个结果,另一座却把它归档为“游戏”一类。

所以,对中国AI真正重要的那条脉络,是穿过DeepMind,而不是OpenAI——这不是品味问题,而是方法问题。西方所叙述的前沿沿着OpenAI走:把下一个词的预测不断放大,直到能力涌现。而中国一直在构建的那一条,沿着DeepMind走:强化学习、搜索、自我对弈,瞄准那些有正确答案的问题。这是关于“智能究竟为何而存在”的两种不同的赌注——而当DeepSeek的R1落地时,它押的是后一种。


两机一智

这个故事在现代中国历史上已经上演过一次了。

1955年,在与FBI斗争了五年之后,钱学森回到了中国,脑子里装着美国火箭技术和在喷气推进实验室(JPL)的十年经历。国家围绕他建立了一整套机构。随后而来的就是两弹一星——对于一个工业基础被摧毁的贫穷国家来说,这是一个不可能完成的雄心计划。在苏联撤走援助之后,这个计划被普遍认为不可能成功。这确实有充分的理由——当时的中国比撒哈拉以南非洲的大部分地区还要贫穷得多,火箭项目的大部分是在西部农村完成的,有些地方起步时连自来水和电都没有。

但它最终实现了它设定的所有目标:1964年原子弹,1967年氢弹,1970年卫星。一句口号、一个计划、一次国家级的冲锋,让中华人民共和国在美国和苏联的双重压力下,同时蜕变为一个战略大国。

直到今天,这仍然是学校里引以为傲的教材。这是代际性的"国家+科学"在超级大国竞争的截止期限前执行的经典中国语汇。引进的催化剂,本土的系统,文明的灵魂。

朱松纯,中国通用人工智能研究的教父和北京通用人工智能研究院(BIGAI)院长,已正式向中国最高政治协商机构提出,应将AI研究提升至与两弹一星同等的地位。他非常有影响力。

这就留下了一个问题。如果AGI是两弹一星的后继者,那么它的制度载体是什么?我的分析推断是:中国不需要创建一个新的。它已经有了一个家。

它已经有一个家了。

两机,是一项现有的国家级顶层计划。它涵盖航空发动机和重型燃气轮机,写入十三五和十四五规划,通过在2016年将四十六家分散的发动机单位整合为中国航空发动机集团而得以执行。这是中国最接近战略层级、国家动员、代际积累的科研计划。

什么是两机,为什么重要?

两机将化学能和核能转化为电力、转化为推力、转化为工业做功——通过超高温涡轮。航空发动机和燃气轮机。

七十年来,心脏病一直是中国无法制造世界级喷气发动机的标准比喻。一种你只能与之长期共存的慢性病。中国可以造出高铁、第三代核反应堆、月球采样返回探测器——却仍然要为自己的旗舰客机C919,购买挂在机翼下的发动机。一个有慢性心脏病的国家,无论腿有多强壮,都无法奔跑。

它之所以难,不在于工程原理有多玄奥,而在于材料。一片现代涡轮叶片,工作在比它自身金属熔点还要高的燃气里,能够存活,只是因为几十年间打磨出来的一整套冶金手段。合金每走一代,西方大约要花十五年。2020年的专家共识是,中国在热端部件——发动机里最灼热、金属离失效最近的那个核心——上落后了三十年以上。今天,大多数西方分析仍然这么认为。

我的分析引导我为了概念完整,将认知也加入到计划名称当中:两机一智。这个"智"不是聊天机器人。它是搜索材料、优化工业循环、运行闭环回路、并交付下一代涡轮热端部件的AI——没有它,“躯体”便交付不出成果。两机在明处,一智在暗处——而且我相信,它们是绑在一起执行的,写在同一个计划里。


DeepSeek时刻,重估

2025年1月20日,DeepSeek发布了R1。西方报道把它吸收为一个成本故事:中国用五百万美元追上了OpenAI。可怕。重新校准。真正的故事不是关于成本。而是关于方法。

OpenAI的o1在四个月前发布——这是第一个公开证明在大规模强化学习下进行推理训练的大语言模型。但o1是封闭的:博客文章描述了结果,方法是商业秘密,系统卡片(System Card)无法复现。R1是同类型的模型,但整个训练流程在一篇可同行评审的论文中完全公开。算法伪代码、奖励函数、训练动态、失败模式,全部直接进入公共领域。

DeepSeek是第一个发表的,并且在这样做的时候拉开了后训练时代的序幕。六十天内,地球上每一个前沿实验室都复现了GRPO或一个接近的变体。六个月内,它成为了领域标准。

成本故事错失了重点,因为成本本来就不是重点。重点是方法。训练一个模型,不是去模仿正确的文本,而是因为给出正确答案而获得奖励。用一个对结果的价值函数替换掉有监督的老师。没有人在循环里,除了作为奖励规则书写者的人。

这不是一个大语言模型技术。这是应用于语言的AlphaGo技术。在一个搜索空间上进行强化学习,用一个可以验证结果正确性的验证器取代人类评分员,产生出没有人教模型去写的推理轨迹。

ChatGPT发布后,谷歌陷入了恐慌。他们的第一反应是Bard,它在2023年2月的首次公开演示中搞砸了,一天之内让Alphabet市值蒸发了1000亿美元。于是恐慌加剧了。两个月后,DeepMind被与Google Brain合并,Hassabis成为了合并后实体的CEO。Gemini变成了他的日常工作。Hassabis被他自己的雇主拽离了轨道。中国的AI界没有Sundar Pichai。

大语言模型竞技场是一场鹦鹉之战。中国人来晚了,却通过把乌鸦重新加入战场而改变了游戏规则。


中国AI的暗物质是材料

为什么是材料?因为这是AlphaFold和GNoME模板最能严丝合缝嵌入的领域,也因为材料是每一个二十一世纪工业瓶颈真正所在的地方。燃气轮机热端部件就是一个高温材料问题。超临界CO₂动力循环是一个合金腐蚀问题。核聚变是一个面向等离子体材料问题。电池能量密度是一个化学搜索问题。后硅时代的计算是一个二维材料问题。这里的每一个,都是一个在成分和加工参数上进行高维组合搜索的问题——恰恰是AlphaFold曾经为蛋白质、GNoME为晶体结构所攻克的那种问题形态。这些轴线上的停滞不前,恰恰是中国慢性心脏病的根源。

AI4Mat(AI驱动的先进材料)本身是不够的。一个能提出一百万种候选合金的模型,如果你不能制造它们中的任何一个,测试它们中的任何一个,那就毫无意义。这正是西方在过去三十年里,以每十五年一代的速度从第二代高温合金缓慢走到第三代的地方——因为那些时间的大部分都不是科学,而是从实验室到铸造厂、从铸造厂到原始设备制造商、从原始设备制造商到适航认证之间的制度摩擦。

中国搭建的东西不同。支撑两机的AECC整合,加上无锡、宝武、鞍山以及AECC铸造网络中已有的中试基础设施——整套体系都被刻意设计来压缩从实验室到合格件的交付周期。中科院深圳先进院的19个智能体驱动的自主发现系统不只是生成候选材料,它还通过预先敲定的认证协议,把方案直接导入中试规模的试制——这在西方现有体制下往往需要数年才能搭建起来。

无锡透平叶片不等同行评议。仿真一旦收敛,便直接开炉浇铸。

这是即便以DeepMind的体量、也因受制于自身体制而买不到的那一半。Hassabis模板,加上一个大陆尺度的验证场,统于同一套协调机制之下。中国是目前唯一同时握着这两半的国家。

而回报已经开始到来了。


心脏病,在治了

五年的准备。然后,从2020年开始,一次相变。

2020年3月

CJ-2000核心机实现首次点火,达到设计转速的100.6%。C929的未来动力装置突破了它的第一堵墙。

2024年10月

中国首台完全国产的300兆瓦F级重型燃气轮机在上海点火——八年研发,50,000个部件,与航空发动机项目共享同一套热端冶金。

2025年2月

CJ-2000完成全状态高空台测试。峰值推力35.2吨——遄达1000/GEnx级别。累计运行超过3000小时,据称比GEnx燃油效率提高15%。叶片废品率——即铸造出的叶片有多少通不过检验——从30%降至7.8%,这是一个与推力同样重要的制造成熟度信号。

2025年12月

中南大学在《npj Computational Materials》发表了一篇论文:CSU-S1,一种通过自然语言处理和机器学习管道端到端设计的低成本镍基单晶高温合金,该管道筛选了340,000个虚拟成分。γ'相溶解温度接近1300°C,在1100°C / 137兆帕条件下蠕变寿命224.7小时。性能可与西方第三代参考合金相当。成本更低。这是首次经同行评议确认AI4Mat在中国产出了涡轮级别的合金,而不仅仅是筛选候选物。

两个发动机项目——宽体商用与重型工业——在共识认为需要三十年的五年内,从远远落后走到了可能的并跑。CJ-2000的3000小时累积测试数据,是最重要的信号。中国历史上的失败模式是热端蠕变疲劳——金属在高温和负荷下被长期持有时缓慢变形——是之前每一个走到末路的项目所撞上的那堵墙。3000小时的台架运行意味着这堵墙已经被突破——至少在试验台上。

推断

说清楚,没有人宣称这些具体的发动机是由AI设计的。CJ-2000已经研发多年,单凭蛮力工程也足以解释这些里程碑。论文措辞很谨慎,我也一样。我们能说的是:工具箱已在手中,验证场正满负荷运转,研发周期正在急剧压缩。下一代——2030年代到来的那一批——几乎可以肯定已经在每一个重要的中国实验室里,通过AI4Mat管道跑起来了。


如果它成功,什么会坍塌

如果这个论断有一半是正确的,那么以下事情将在2035年之前坍塌:

  • 单晶高温合金护城河崩塌。GE和罗罗失去在商用宽体推进领域最后的架构性优势。
  • 超临界CO₂循环 从产品类别变为平台,将地球上每一个热源包裹在紧凑高效的能量转换中。
  • 核聚变从材料侧加速压缩。
  • 电池化学迭代固化为永久性领先。
  • 华龙、玲珑、HTR-PM通过冶金,悄然成为各自领域中的最佳。

这些每一项,在西方媒体中都会以工程公告的形式到来;没有人会把它当作"AI故事"来报道,因为它从来不会以这种方式被宣布。产生这些结果的AI层将始终保持不可见。这正是Hassabis模板从一开始就注定要运作的方式。


结语

大语言模型竞赛是喧嚣的。它是公开的。它是一门巨大的生意。那是可见的物质。但就像在我们所知的宇宙中一样,暗物质比我们能看到的要多得多。

更重的赌注,是Hassabis教他们如何造的那只乌鸦——那只他自己的公司不得不部分搁置到一旁的乌鸦。这个赌注是在2016年,跟中国航发和两机计划一起,在同一个五年规划里押下的。它已经运行了十年。DeepSeek R1是一团可见的火焰。野火仍在燃烧,在西方探照灯照不到的地方。

回报不会以一个聊天机器人的形式到来。它将(也许已经开始)作为一片合金、一片叶片、一个反应堆容器、一种电池化学物质到来——通过一架中国商飞的飞机、一台中国航发的涡轮、一个中核集团的反应堆或一块宁德时代的电池组交付出来。而当它到来时,没有人会叫它AI。他们会叫它发动机。叫它核反应堆。叫它车。

确诊七十年之后,中国终于不必再在自己最先进的战斗机尾部,挂上一台俄罗斯发动机。心脏病正在痊愈——而这一件,同样不会有人叫它AI。

尾声 · 假设AI暗物质存在于先进材料领域

两个信号,将在未来两年内告诉你这个论断是对是错——两个都几乎完全不可见,除非你知道自己在找什么。

旁注一 · 化学铼的棘轮

先从铼说起,因为它是最干净的观察对象。最好的涡轮叶片之所以能在超过自身金属熔点的高温下存活,部分要归功于掺进去的几种稀有元素,而铼是其中最稀有、也最关键的一种。多加几个百分点,叶片寿命就能大幅延长,或者发动机可以运行得更热——而这一点余量,大致就是西方一代合金与下一代之间的差距。

问题在于供给。全球每年只产出50到60吨铼——作为对比,黄金约3000吨——而它只能作为铜矿副产品的副产品被开采出来,所以你无法决定多生产一些。中国几乎不产铼,而全球约80%的供给早已被西方喷气发动机占用。2025年美国对LEAP-1C发动机断供之后,“在不损失性能的前提下少用铼”成了中国每一份高温合金路线图上的明确优先事项。

一种高端高温合金要调配八到十二种元素,可能的配方数量大到天文数字——远非试错法所能穷举。这恰恰是机器学习最擅长的那类问题。中南大学的CSU-S1论文,是它正在奏效的第一个公开迹象:从340,000个候选配方中筛选出一种,第三代性能,成本更低。成本更低,几乎肯定意味着用铼更少——因为铼大约4000美元一公斤,而镍只有15美元。如果这条曲线成立,铼的瓶颈会在十年内不再是瓶颈——不是因为中国找到了更多铼,而是因为它绕开了对铼的依赖。

关注什么 · 2026–2028 一篇经同行评议的中国论文,报道一种AI设计的镍基单晶叶片合金,铼含量在2–3%区间,却拥有与西方最好的第三代合金相当的耐久力。这一个数字——一种生产级合金在仍能存活的前提下需要多少铼——是整个框架中最干净的单一可量化指标。当那篇论文落地的那一天,西方在涡轮冶金上长达七十年的领先,在结构上就结束了。
旁注二 · 协同中试周期速度

在实验室中发明一种合金是容易的部分。让它通过适航认证并装入飞行发动机的生产涡轮叶片,在西方是一个十五年的项目。原因不在化学。原因在于制度摩擦——材料成熟过程的三个阶段之间的对接是定制的,并且默认没有资金支持。

第一阶段是实验室规模:一块试样、一粒纽扣、一根棒材。以克为单位的材料,理想条件,单性能测试。第二阶段是中试。以千克到吨为单位,真正的铸造设备,真实的工艺波动,多性能认证活动。第三阶段是生产:工业体量,认证供应商,全面的蠕变-断裂和疲劳测试,监管签字放行。每个阶段都要花数年。瓶颈在于交接:实验室的人不跟铸造厂的人说话,铸造厂的人不跟主机厂说话,主机厂直到后期才跟认证机构说话。每一个新合金换代时,每一个接口都要从零开始重建。没有常设的制度管道。

西方的模式是为每一个新合金组建项目特定的联合体——GE加上普惠加上罗罗加上一个国家实验室再加一个大学。这就是为什么第三代合金花了三十年才从实验室验证走到合格的飞行硬件。那些时间大部分都不是科学。是制度摩擦。

2016年后中国搭建的体系,正是为了刻意压缩这一交接周期。“揭榜挂帅”机制允许任何团队竞标国家资助的材料项目(含认证环节),使联合体得以常态化,而非随项目重组。科技部的AI4S计划提供算法层支持,中国航发的整合把整机方收拢为单一国家主导的对接方,而宝武、鞍钢、无锡精密铸造集群及航发自建铸造网络,则共同构成了合金走向量产必须跨越的中试基础设施。整套链条是一条高度协同的常设管道。中科院深圳先进院的19智能体自主发现系统不只生成候选配方,更能通过预先敲定的认证协议,直接把方案导入该管道——这在西方联合体中,往往需要数年谈判才能落地。

关注什么 · 2026–2028 任何中国行业或学术出版物,报道一种新型涡轮级合金从实验室验证到经过认证的生产部件,端到端认证时间在24个月之内。化学论文是下游证据。周期速度才是真正的机制。若某款具名合金的中试至认证周期被压缩到24个月以内,那真正持久的优势就在于制度创新——化学成分或许能被逆向工程,但跨部门协同却极难复制。