设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 296|回复: 8
打印 上一主题 下一主题

[科技前沿] 全球主权AI实验室巡礼-序章

[复制链接]
  • TA的每日心情
    开心
    2020-4-8 10:45
  • 签到天数: 227 天

    [LV.7]分神

    跳转到指定楼层
    楼主
     楼主| 发表于 6 天前 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 xiejin77 于 2026-6-16 09:20 编辑
    ' b6 S4 o) L' }$ x4 E, k6 ?' t* o. z) F- D0 K
    遵照赫然老师的指示,把这个巡礼系列发过来吧。@赫然   w0 f3 @* t6 K% g1 B
    7 v  q  h4 `! b* J
    9 N2 q! i% z8 }1 _) f
    告别"硅谷霸权":全球主权AI大基建时代7 \( |) h/ S! M
    " J! ]& [0 X! v" o* K- \0 L

    系列:《全球主权AI实验室巡礼——在大国博弈中寻找"破局者"》 第一篇 | 导论篇

    - G( q" @" c+ c
    引子:军火商的布道

    2024年2月。迪拜。世界政府峰会。

    5 v' v9 h8 j# W  A

    Jensen Huang穿着那件价值几千美元的黑色皮夹克站在台上,面对台下沙特、阿联酋、印度、日本的部长和王室成员。他的声音低沉而笃定:

    "每个国家都应该拥有自己的主权AI。你不能允许这种事情由别人来完成。"

    ; E; u6 \* \) R5 Z( [& h

    台下点头如捣蒜。

    "有一种新型的数据中心——不是用来存文件的,是用来生产智能的。每个国家都需要一座。"


    4 x; O; b: b& ?" P5 z0 A

    那一刻,全球最贵的一场推销完成了它的加冕仪式。一个诞生不到两年的概念——"主权AI"——被正式写入了每一个在座国家的政策备忘录。而说出这个词的人,恰好是那个控制了全球AI训练芯片80%以上市场的公司的掌门人。

    3 e6 }7 E% ?9 \, n4 k: D: ^, t

    这是21世纪最精致的商业悖论:一个垄断者,在兜售反垄断方案。一个美国公司,在鼓动世界摆脱美国的科技依赖。一个本身就是"主权风险"的实体,在兜售"主权解决方案"。

    % Y0 F+ N7 V" m8 Q/ P1 c6 N

    Jensen Huang是世界历史上最成功的军火商——只是他卖的不是子弹,是GPU。而当军火商开始呼吁"和平"的时候,你最好读一下合同条款。

    因为这场主权AI运动的真相是:不管你选哪条路,路都是由NVIDIA铺的。

    ---


    ' l4 }1 Z; ~: ~# l' v

    这个系列试图讲述的,就是在Huang的布道词背后,地球上正在发生什么。

    1 }, w. r- d3 L# J

    在首尔,韩国最大的互联网公司Naver Cloud在"国家代表AI"项目第一轮评估中出局。理由不是它不会做AI,而是它提交的HyperCLOVA X SEED 32B模型被指使用了阿里Qwen的视觉编码器和权重。在技术世界里,这叫复用成熟开源组件。在地缘政治世界里,这叫主权瑕疵。

    6 w  u  Q0 J; a* t# \' f- K

    在阿布扎比,G42的高管们正坐在谈判桌前——对面是美国商务部的官员。谈判内容不是估值、不是股权、不是技术路线图。而是:你们必须切断与所有中国科技公司的联系,否则微软的15亿美元投资将被华盛顿拦下。一个中东公司的主权AI,需要美国批准,才能获得美国投资来对抗中国影响。"主权"两个字,在这里被压得很薄。


    8 i5 K0 A0 Q' S8 E+ ^0 K' }

    在孟买,AI4Bharat实验室的研究生们正在把自己的祖母拉进录音棚。她们要录的不是流行歌曲——是泰米尔语的日常对话、马拉地语的童谣、泰卢固语的菜谱。这些声音将变成印度主权AI的训练数据。技术工程当然在场,但更刺眼的是另一件事:22种官方语言、上万种方言,正在对抗一个只用英语思考的AI帝国。

    & m! B/ ?8 O7 l+ ?

    在苏黎世,工程师们在一个前身为教堂的建筑里调试Alps超级计算机。他们正在训练的Apertus模型支持罗曼什语——一种只有4万人使用的瑞士少数民族语言。4万人的语言,值得拥有自己的AI吗?瑞士人的回答没有犹豫:如果AI只需要服务"足够多"的人群才算有价值,那AI本身就不值得被信任。

    " d# G" h  D% n  J3 }- b9 R8 c

    在首尔(另一个场景),韩国国家代表AI项目的评审规则中有一条红线:模型必须证明自己不是被外部技术牵着走。Naver倒在了这条线上。《东亚日报》的标题冷如刀锋:"Naver、NC在国家AI第一轮评估中出局。"在这个二选一的世界里,技术洁癖已经变成了一种战略资产。

    在伦敦,英国AI安全研究所的研究员们正在对一家美国公司的前沿模型进行极限测试:它能设计生化武器吗?它能自主复制吗?它会系统性说谎吗?他们不建模型——他们审模型。这里的主权不靠建造,而靠否决

    ) T( N5 `" |% d

    在华盛顿,政策圈子里没人说"主权AI"这个词。不需要。当你的产品是全球默认值时,"主权"是你不需要强调的东西。OpenAI的GPT、Google的Gemini、Anthropic的Claude、Meta的Llama——这些不是产品,是默认操作系统。当每个人都在用你的基础设施时,你不需要主权这个概念——你需要的是让这个概念显得像是别人自己想到的。

    . E( x+ s, r/ [6 B7 r5 `" U

    把这些场景放在一起,图景就清楚了:一个芯片垄断者在全球推销"去中心化"。一个不需要"主权"的国家在替别人设定主权的边界。其余七十多个国家,则用砸钱、立法、开源、自研、选边站,回应同一个问题:

    / N: r" _) y  z+ h

    当硅谷的API和模型渗透进你的政务系统、你的母语语料、你的国防决策时——你还有没有说"不"的权利?


    0 A# k8 ]* W+ k  H- I

    这个问题的答案,就是接下来八篇文章的全部内容。

    ---

    , L: g: E" {8 D7 g: U3 G7 S" y  o

    第一章:为什么没有美国?——帝国不需要护照
    ; W- J8 h+ g' j: R! }

    如果有人问我这个系列为什么没有单独的"美国篇",答案很简单:美国不是这场运动的参与者,它是这场运动的原因。

    把太阳写进行星名单是一种分类错误
    ' l8 O$ _8 S& ?: f6 s7 B

    全球AI权力结构有一个根本性的不对称:一家美国公司控制了80%以上的AI训练芯片(NVIDIA)。三家美国公司控制了全球三分之二的云计算市场(AWS、Azure、Google Cloud)。五家美国公司定义了前沿AI模型的标准(OpenAI、Google DeepMind、Anthropic、Meta、xAI)。超过60%的全球顶尖AI研究人员坐在加州的办公室里领工资。


    : P9 a# Y* Q' p& ^' P8 C1 M

    这组数据描出的,不是普通市场参与者,而是一个帝国的轮廓。


    + o) h. p' L4 H- M4 K

    当你的技术已经渗透到全世界每一个智能手机的默认输入法、每一个跨国企业的ERP系统、每一个政府的自动化决策流程时,你不需要"主权AI"这个词。你需要的是让这个词听起来像是别人自己想出来的——这样他们就会心甘情愿地用你的芯片来"对抗"你的霸权。

    这就是Jensen Huang在做的。

    0 {7 r" A) `  `2 ^

    把美国放进这个系列里"巡礼"一章,就像在一本反殖民主义的著作里,用同等篇幅给大英帝国一个"案例研究"——这不仅是逻辑上的不自洽,更是叙事上的投降。美国的AI不是主权AI的一种,它是所有其他主权AI试图解决的问题。

    主权不需要被命名——除非它正在被剥夺6 y; V" k; u/ E( S4 }8 |3 R

    一个关键的认知锚点:历史上,权力从来不需要给自己命名。"自由贸易"在19世纪不需要前缀——因为大英帝国的海军定义了什么是"自由"。"国际秩序"在20世纪不需要解释——因为华盛顿定义了什么是"秩序"。


    5 k1 m# i2 H# [7 V3 ?+ G; J

    同理,"AI"在2024年之前不需要"主权"这个前缀——直到各国政府突然意识到了一件事:

    他们租用的API可能会被关停。他们依赖的云服务受制于外国法律。他们委托训练的模型在回答政治敏感问题时,会先经过加州的价值观审查。


    & M, @, `1 B  W" O

    2023年,美国商务部长雷蒙多说:"我们不会允许中国获得可以用来对付我们的先进芯片。"这番话的本意是遏制中国。但它的副作用是——所有其他国家都听到了同一条信息:在AI的牌桌上,发牌权在华盛顿手里。你能不能上桌,牌注多大,游戏规则是什么——不由你决定。

    全球主权AI运动真正开始于那一刻:一个又一个国家发现,自己的AI基础设施并不是稳固的基础设施,而更像租来的领空


    , ~; V# N3 A1 R0 \8 M

    雪崩来临之前' P2 e3 m. i. _7 @

    Snowden在2013年揭露的事实——美国科技公司向NSA提供用户数据——在当时被准确地描述为"监控丑闻"。但现在回过头看,那个事件是数字主权时代的奠基时刻。它第一次让全世界意识到:基础设施不是中性的。云端不是无主的。一个美国公司的服务器,就是美国领土的数字延伸。

    而当AI模型能够处理的信息深度远超通信元数据——它能理解你的文化价值、模拟你的经济行为、预测你的政治决策——这种依赖的代价就不再是"隐私风险",而是生存焦虑

    ' y$ C, I+ y; m0 e

    一个使用OpenAI API处理外交电报的欧洲国家。一个依赖Google翻译保护少数民族文化的东南亚政府。一个在微软Azure上运行国防后勤AI的北约成员国。在关键时刻,他们有没有说"不"的权利?

    答案很可能是否定的。因为"说不"的代价不是换个供应商,而是整个AI基础设施的瘫痪。锁定效应走到这里,已经从技术锁定变成了存在性锁定

    & z2 @4 C8 L/ j$ Z

    悬置帝国,才能看清自己
    $ v: _9 m8 ^* r5 i- u' f# w# k' N

    本系列故意把美国从"被观察者"的位置上移除,不是因为它不重要——恰恰相反,是因为它太重要了,重要到如果你把它放在任何一个国家的旁边对比,它会把所有其他故事都吞没。

    只有当你读完了中国全栈突围的代价、欧洲合规护城河的挣扎、中东"钱买主权"的悖论、印度22种语言的AI正义之战、英国用"审计权"替代"建设权"的智慧、新加坡用5.6万平方公里撬动6.8亿人的野心——你才会真正理解美国那套"AI就是AI"的叙事有多奢侈。

    帝国不需要护照。因为在帝国的视角里,世界就是它的疆域。

    # ^' c& i7 ]8 k. x3 U" F

    而本系列要做的事情,恰恰相反——它要让帝国之外的所有人,重新画一张自己的地图。

    ---

      d6 _! t" u2 [9 t5 I; Z& {

    第二章:概念的短促一生——从伦理遮羞布到算力军备竞赛0 n  Z& x1 T7 p0 K* }. _

    "主权AI"从学术角落词变成国家战略核心,只用了不到五年。但这条演化路径本身,就是一部全球权力转移的微缩史。

    9 c! J) K6 A* d# x. u' t; \

    第一幕:Snowden教会了全世界一件事(2013—2018)4 O5 z/ u* I" K2 P

    2013年,Edward Snowden从夏威夷飞往香港,随身携带的硬盘里装着美国NSA全球监控计划的证据。PRISM项目名单上赫然列着Google、Facebook、微软、苹果。

    8 m' c' Q+ o- H7 Z- f

    欧洲的反应不是愤怒——是耻辱。


    + s8 r+ ~, g8 n- J7 Z) U+ S

    "我们所有的数据都在美国的服务器上。"这个事实在被间谍活动利用之前,首先是一种主权放弃。2018年,GDPR以一种几乎报复性的严厉姿态登场。2019年,德国和法国共同推出GAIA-X——一个旨在建立欧洲自主云基础设施的计划。


    # ~" k) p( t8 Q& d# O0 `

    这个阶段的"主权"还是朴素的:数据留在我境内。服务器由我控制。不要所有的技术栈都指向西海岸。

    这是一个关于物理控制的焦虑时代。AI此时还不在讨论的中心——它看起来太遥远了。人们不知道的是,这种天真正在倒计时。


    ( g9 g/ v3 z- a4 @. A! u3 {

    第二幕:伦理战争的虚无陷阱(2019—2022)
    - n+ y6 b; M6 \  ?

    当AI开始被部署在司法、医保、信贷、招聘系统里时,全球涌起了一场关于"可信AI""伦理AI""以人为本AI"的政治正确浪潮。

    2019年,OECD发布AI原则。2021年,UNESCO发布AI伦理建议,193个国家全票通过——这是人类历史上第一次所有国家对一项技术同时说"我们应该善良一点"。

    " X; V" g9 d' d! T5 W

    但这场运动有一个致命的空洞:它只讨论"应该怎么做",从不讨论"能不能做"。

    没有人在这个阶段提算力。没有人在这个阶段提芯片。没有人问:"如果你没有10,000块NVIDIA GPU,你讨论的'主权AI伦理框架'是在讨论什么?空气吗?"

    . j, u4 m5 C" _! s7 x. r- t1 y

    事后回看,这个阶段像是全球政策制定者的一场集体自我麻醉——用伦理宣言替代能力建设,用措辞工整的公报替代产业战略。价值观讨论是廉价的。GPU很贵。


    * t8 ^7 P- M$ z1 [; }8 ]6 X5 s第三幕:ChatGPT让所有人从梦中醒来(2022—2024)
    ' x7 c* y2 Z: y0 t+ u0 c

    2022年11月30日。OpenAI发布了ChatGPT。两个月内,1亿用户。人类历史上增长最快的消费级应用。


    ! y2 c2 X2 T+ G8 k6 q( u

    但真正的震撼不是用户增长数字。真正让各国政府夜不能寐的是另外一组数字:

    一块H100 GPU:2.5万到4万美元。 训练一个GPT-4:至少需要10,000块。 总成本:硬件2.5亿美元。加上数据中心、电力、冷却、人员——5亿起步。 唯一的大规模供应商:NVIDIA。 美国政府刚刚宣布:不许往中国卖。

    2 M7 h3 A6 ?* W) U0 h

    那一刻,"主权AI"从一个论文关键词变成了一个国家安全议题。因为所有人都算清楚了一笔帐:在这场游戏里,门票是一万块H100。没有门票就没有入场资格。而售票窗口只有一间,且窗口上方挂着星条旗。

    Jensen Huang抓住了这个历史性的窗口。2024年2月在迪拜,3月在GTC,每一次财报电话会议——"主权AI"从他嘴里说出来,不像学术词汇,像价格标签。每个国家都需要的"AI工厂",恰好由NVIDIA提供全套施工方案。


    3 @" W( r7 H% I

    有人讽刺他是"卖铲子的"——1850年代加州淘金热、赚得最多的不是淘金者、而是Levi Strauss的牛仔裤和Samuel Brannan的铁锹。但Jensen Huang要聪明得多:他不是在淘金热旁边卖铲子——他告诉所有人这里有金矿,然后说:"顺便,铲子只有我卖。"

    第四幕:全栈分裂与选边站队(2024至今)
    " n7 D8 V# e) S  \3 y

    到2024年中,全球已经形成两条并行但相反的运动。

    * J. |3 p; v* ]- ]

    一边,芯片出口管制不断收紧。2022年10月第一轮。2023年10月第二轮。2024年更新。2025年加码。从GPU性能门槛到互联带宽,从最终产品到制造设备——美国试图在AI芯片的每一个技术维度上建立检查站。

    " ~1 y4 t, `8 F" @

    另一边,主权AI基础设施投资正在变成全球最大规模的公共支出运动之一。欧盟AI大陆行动计划——2000亿欧元。美国CHIPS法案——527亿美元。欧盟芯片法案——430亿欧元。中国大基金三期——475亿美元。日本——约250亿美元。沙特——据报400亿美元AI基金。全球70多个国家发布了国家AI战略。

    ( u0 w8 H& ?. O

    而中国DeepSeek在2025年1月引发的全球震动,给这场运动注射了一剂强心针:DeepSeek-V3技术报告披露的训练算力成本约557.6万美元,随后R1又把这种低成本高性能叙事推到了华尔街面前。NVIDIA市值一天蒸发近6000亿美元。

    0 q4 i! W0 C9 s& ]

    "没有最先进芯片就造不了最先进AI"——这个信念只存活了短短48个月。


    / a; `# y5 \7 I0 w

    到这里,AI基础设施已经从企业资产变成了国家领土;一套新的地缘政治逻辑也随之出现。

    ---


    . C+ J1 |: @# n3 `5 A

    第三章:谁拥有智能?——AI权力的四根支柱
    7 v- Q  x5 @8 n+ G& t

    要理解为什么主权AI如此迫切,必须先看清一个令人不适的事实:人类历史上从未有任何一种技术基础设施,像当前的AI一样集中在如此之少的公司和如此之少的国家手中。

    芯片:你以为你在买显卡,其实你在买护照1 K7 l0 [' s4 F" X

    NVIDIA的数据中心GPU占据了全球AI训练市场的80%到95%。


    7 l! _; `. |+ x; \1 s

    这个数字更像一张主权定价表

    ' Q6 `3 X& G6 d/ F1 H$ t

    在一个成熟市场中,一家公司占据50%份额就被认定具有市场支配地位。80%以上是什么概念?这意味着NVIDIA不是市场参与者——NVIDIA是市场本身

    • 2025财年数据中心收入:1152亿美元
    • 市值:在2024年突破3万亿美元——超过除美中以外的任何国家的全年GDP
    • 训练一个前沿大模型的入门券:至少10,000块H100等效GPU
    • 每块H100批量采购价:2.5万到4万美元。单就GPU硬件,入门费就是2.5亿美元
    • 台积电制造全球约90%的先进AI芯片。而CoWoS先进封装——将所有AI芯片组件"粘合"在一起的技术——几乎是台积电的独家能力
    • 高带宽存储器(HBM)——GPU性能的关键瓶颈——SK海力士独占50%市场  {# j8 ^! e: Y

      ) H6 r" o% ^* n! Z

    这个供应链的任何一个节点,都在单一公司或单一国家手中。NVIDIA设计、台积电代工、CoWoS封装、SK海力士HBM供应——四个节点,跨越四家公司,但四家公司全部在一个地缘政治轨道上:美国及其最亲密的半导体盟国。

    供应链上的任意一个节点被政治化,就足以瘫痪全球AI发展。而美国已经在这么做了——不是通过市场手段,是通过出口管制

    2022年10月。2023年10月。2024年更新。2025年加码。从GPU性能指标到互联带宽,从芯片本身到制造设备(ASML的EUV光刻机)——美国正在AI芯片的每一个技术参数上设置检查站。"贸易限制"已经不足以描述这套机制,它更接近一种常态化的技术封锁外交。

    而芯片只是第一根支柱。


    4 u3 ?, ~8 o3 ?: M. S' g

    云计算:你的领土,我的服务器# ~+ _8 _# n- e6 y

    AWS(31%-33%)、Azure(23%-24%)、Google Cloud(11%-12%)。三家美国公司,合计控制全球约三分之二的云基础设施市场。

    当一个国家的政府将政务服务迁移到"AWS东京区域"或"Azure法兰克福区域"时,数据确实在地理上位于该国境内——但管辖权呢?美国《云法案》(CLOUD Act)授权美国政府要求任何美国云服务商交出存储在海外的数据。不是需要当地法院的配合。是直接要。

    所以"主权云"首先不是技术术语,而是管辖权概念。德国、法国、印度、阿联酋——不管是自由民主国家还是君主制石油国——都在做同一件事:建自己的数据中心,用自己的法律管辖自己的数据。因为不论一个云服务商的"区域"叫什么名字,只要它注册在特拉华州,它就最终回应特拉华州法院——以及华盛顿。

    " D" C+ J- o3 x

    基础模型:默认为硅谷
    4 A- d: n) s' V* R5 O

    到2026年,真正拥有从零训练前沿大模型能力的实体,全球不超过15个。其中超过一半在美国。


    / Q' X6 R, g; j" R" ^

    OpenAI的GPT-4o。Google的Gemini。Anthropic的Claude。Meta的Llama。xAI的Grok。欧洲只有Mistral。中国有DeepSeek、Qwen、ERNIE。阿联酋有过Falcon。韩国正在攻关。印度刚刚起步。

    0 R4 D. `: G. ~5 d$ \( n$ ~

    训练一个Griffin级别的模型——算力的估计已经逼近10亿美元。这已经不只是"昂贵",而是结构性排他。对于绝大多数国家来说,训练前沿大模型不是一个"难不难"的问题,而是一个"有没有资格"的问题。

    - f1 |$ ^8 A9 K$ U

    更残酷的是:能力差距不是在缩小,而是在系统性地拉大。领先模型正在从"更好的语言理解"演进到"推理能力、自主代理、多模态感知、工具使用"——这些能力定义的下一代AI,将不是"参数更多的LLM",而是一个全新的技术物种。如果你现在才刚入门LLM,你已经落后了一代。"模型鸿沟"正在变成"物种鸿沟"。


    ! y4 e& Z/ a/ Q- I0 r5 e

    数据的无声分配( e$ e7 _# r! I- L0 ?

    非洲贡献了全球不到1%的AI训练数据,却拥有17%的世界人口和约2000种语言。全球约7000种语言中,不到4%在主流AI训练数据中有意义的存在。


    6 V& Q. l1 X2 k, A

    问题不在于数据采集不够努力,而在于分配结构本身。AI训练数据主要来自互联网。互联网的内容主要由富裕的、英语为主的、北半球的创造者生产。AI从这个互联网学习,它的"世界观"就是这个互联网的世界观。然后这个AI被部署到全世界——成为一个披着科技外衣的地域偏见


    : a' X1 Q* M3 Q

    这四根支柱——芯片、云、模型、数据——共同撑起了一个权力结构的穹顶。而这个穹顶的中心在加州。


    , H5 t. b6 v1 M2 o; J! E

    主权AI运动的一切,无论是DeepSeek在芯片封锁下的奇迹、还是印度把祖母的泰米尔语录入训练集、还是瑞士为4万人的语言训练模型——都是在尝试在这个穹顶上凿开一扇窗。

    ---

    ! M9 s- }: A3 v, {! N5 d4 U

    第四章:五重恐惧——为什么主权AI不是选项,是本能
    ) u1 a: u1 s2 ?2 V

    主权AI不是被"论证"出来的。它是被出来的。

    * J4 p$ {: i9 L9 a3 k9 @" o

    第一重恐惧:锁喉之惧
      y2 U1 p0 q1 d' t9 Z6 S

    这个恐惧有一个中文名字——"掐脖子"。


      j: ^. y. B# d, L5 J* @, S

    2023年10月17日,美国商务部工业与安全局(BIS)发布了一份长达数百页的出口管制修订案。核心条款是:对华禁售超过特定算力密度的AI训练芯片。A100不行。H100不行。此后推出的任何高性能AI芯片,只要技术指标越过红线,一律禁售。

    & u! L: Z% s' T# z! @

    对中国来说,这是一次国家级"断供"。对全世界来说,这是一个示范:如果华盛顿可以切断北京的芯片供应,它能不能切断任何一个国家的?

    答案不需要猜测。依赖NVIDIA GPU的每一个国家都在同一时刻意识到——你的AI基础设施不是你的。它是一根管子,管子的阀门在别人的手里。而那个人刚刚当众拧了一下。

    ' y# S$ F% \) I& F2 i

    "掐脖子"已经从中国的特定焦虑变成了全球共用词典。如果你没有替代芯片来源、而你又不是美国的"盟友"、或者你今天是盟友但明天可能因为一项新政策变成"有限合作伙伴"——你的AI主权不是被论证着丧失的,是被政策一次性注销的。


    - Y5 Q) K8 n9 J0 p

    第二重恐惧:语言灭绝之惧
    " U8 v6 U0 H% ^+ d- I, E

    冰岛。人口不到40万。冰岛语,古诺尔斯语的直接后裔,记录了一千年前的维京史诗。冰岛有句谚语:"语言是穿上外套的思想。"如果你丢了外套,思想赤裸、无处可去。


    ' |* \( i) v; @5 L0 W/ m+ y

    2023年,冰岛教育部长公开说了这样一段话:如果下一代冰岛孩子对着手机和电脑只说英语,冰岛语将在两代人内变成博物馆里的展品。 这位部长不是在危言耸听——他是在描述一种已经开始了的过程。冰岛政府紧急与OpenAI合作,把自己的语言塞进GPT-4的训练数据。

    1 T! s( A; K1 n) z; Z& A- _

    类似的案例正在变多。

    8 Z0 p9 C. X) K4 S3 R, ?5 |

    荷兰语正在被"Dunglish"侵蚀——学生在ChatGPT上写作业,输出的荷兰语在句式结构上越来越像英语。巴西两亿人的葡萄牙语,正在被欧洲一千万人的葡萄牙语版本"殖民"——因为AI训练数据以欧葡为主,巴葡被视为偏差。尼日利亚的伊博语使用者在ChatGPT上用伊博语提问,回复是约鲁巴语——因为AI分不清这两种完全没有亲缘关系的非洲语言。


    " y1 s( @6 R) P

    地球上约7000种语言,只有不到4%在主流AI训练数据中有意义地存在。对于剩下96%的语言——和说这些语言的数十亿人——AI不是工具。AI是一个沉默的灭绝事件。 它不主动消灭你。它只是假装你从未存在过。


    ( s! e: y& Z3 u! s7 Z2 S& W& D% C

    第三重恐惧:数字封建主义之惧8 O5 s: e8 h) I7 V2 R. {1 w* E

    "A few platforms own the digital infrastructure of society. Everyone else — including national governments — are merely tenants."


    2 l& V: C  H5 }6 n: {6 I# ]

    "数字封建主义"这个词正在从科技批评的边缘进入政策制定的中心。


    ; Q9 e* j; s* p; c) G" U8 r7 B

    这个概念描述的秩序是这样的:少数科技巨头——以加州为核心——拥有云计算、AI模型、搜索引擎、社交媒体、数字支付的全部基础设施。你是一个政府,你可以"租用"这些基础设施来运行你的政务服务——但你永远不拥有它。你遵守它更新的服务条款。你接受它单方面调整的定价。你看不到它的算法是怎么做决策的。你无法审计它的安全边界。你无法影响它的进化方向。

    2 F6 x# V$ V2 f2 s4 ~+ n7 ]

    在这个秩序里,主权国家政府是租户,科技公司是地主。你的GDP数据跑在亚马逊的服务器上;你的外交照会穿越谷歌的翻译器;你的社会福利分配依赖微软的AI模型;你的选战舆论战场由Meta的推荐算法定义。


    " c1 F6 T) M& m' p( f3 S" ?* j5 {

    "主权AI"在这个框架下更接近产权革命,而不只是技术竞争。它试图追问的是:当数字基础设施已经变成了社会运转的必需品,你对它的产权怎么可以是一纸服务条款?

    第四重恐惧:敌方比我更懂我之惧
    & U! Z% v( [1 t5 u8 ?7 O: p' U

    各国安全委员会的机密简报里,这种恐惧的表达更直白。

    "如果对手的AI比我们自己更了解我们的国家,会发生什么?"


    . U$ L& Y* A' B8 I& a2 C+ _5 B. P

    一个外国AI系统,摄入了一个国家的全部公开数据——政府文件、卫星地图、新闻报道、社交媒体讨论、科研论文、遥感影像。它开始建立模型:经济脆弱性分布、关键基础设施冗余度、政治决策模式、社会压力点的转移轨迹、特定人群对特定信息的反应概率。

    这已经超出传统"间谍活动"的范畴。它是可规模化的、自动化的、实时更新的战略剖析。传统的间谍需要十年才能建立的对一个国家的深度理解,AI可以在没有人类情报官参与的情况下完成——而且更新频率以"天"为单位。

    * R& i: Y( ?" V* S9 Q

    Rishi Sunak在2023年布莱切利公园峰会上的一句话,是对这种恐惧最准确的表达:"迄今为止,只有开发者了解前沿AI的能力。但责任——对后果的责任——落在我们这些民选政府身上。这种不对称不能再继续。"

    直译过来就是:政府必须在最敏感的基础设施中运行的AI模型上拥有独立的安全评估能力。不能把"安全"外包给制造模型的公司的免费声明。


    + A" \2 w) C' W* l. T1 m* y! I

    第五重恐惧:正义不在场之惧+ _' C- U6 A1 @% b

    最后一个恐惧不是关于"他们会对我做什么",而是关于"我永远不在历史里"。

    - X' p, w* V# n" N

    非洲有17%的世界人口和约2000种语言,但贡献了不到1%的全球AI训练数据。非洲农民收到的AI农业建议——来自在北美和欧洲数据上训练的模型——推荐不适合当地土壤的作物品种、在当地没有销售渠道的肥料、照搬发达国家农药标准产生的不合规建议。


    0 z" ~, ?3 a# a; s

    问题不只是"精度不够",而是系统性不在场。AI认知世界的知识来源,决定了谁是"正常人",谁是"偏差案例"。当训练数据96%来自前20%最富裕的语种和地区时,AI不是中立的镜子——它是一个少数人的哈勃望远镜,其余所有人都在它的可见范围之外。

    . J& e( c0 u8 }2 ^5 }! x

    "殖民经济的结构正在代码中复制自己。"这句话正在从批判性学术变成政策界的共识。技术统治往往是殖民主义最有效的当代形态:它不需要士兵,只需要算法。

    ---

    这五重恐惧没有先后顺序。它们同时作用,互相加剧。当一个国家对这三个问题——锁喉之惧、语言灭绝之惧、数字封建之惧——同时感受到紧迫时,主权AI就不再是"政策选项"。它是生存本能

    ---

    6 ~* `9 e5 p5 P( a

    第五章:主权AI的全栈解剖——从沙子到智能/ P) Z' h' `' N- X9 S. w3 {# k

    如果说前四章描述的是"为什么",那么这一章描述的是"是什么"。

    4 ^% i2 ^- \: B; q7 X  }' d( u

    主权AI不是一个单一的动作——不是"训练一个模型"或者"买一批GPU"。它是一个完整的、从物理世界延伸到数字世界的垂直堆栈。

    第一层:半导体与芯片(沙子)
    1 u- n$ E; P/ Z# M# }- P; W

    AI的物理起点不是代码,是沙子——高纯度硅。


    ) J! C6 G7 H4 U. E3 k

    在这一层,主权的含义是极其具体的:

    • 你能否获得足够的高端AI训练芯片?(目前答案:取决于你能不能从NVIDIA买到,以及美国商务部是否批准出口)
    • 你能否自己设计AI芯片?(美国有NVIDIA/AMD/Intel/Google/Amazon/Microsoft;中国有华为昇腾/寒武纪/壁仞;日本有Preferred Networks;英国有过Graphcore;韩国有Rebellions/FuriosaAI)
    • 你能否制造芯片?(这几乎是一个不可能的任务:只有台湾的台积电能大规模制造5纳米以下的先进逻辑芯片;三星勉强能跟上;SMIC通过DUV多重曝光勉强实现了等效7纳米——但那是一个生产一块芯片的成本是正常成本数倍的权宜之计)6 x# J, Q+ c. I$ a8 p; E
      ! c8 e5 \# ]) T, a2 D

    半导体主权的核心困境是:它是一个物理上不可能在短期内去中心化的产业。台积电花了40年、数千亿美元和全球最顶尖的工程人才才走到了今天的位置。对于一个想要在芯片层面实现"主权"的国家来说——除非你是台湾、韩国、美国或中国,否则这几乎是不可能的。


    1 D5 Q( `' |' I+ a  R+ }( u  y: e

    所以"芯片主权"在实践中常常退化为"芯片获取主权":我造不了芯片,但我能不能确保我能买到?

    而"购买"从来不是一个纯粹的市场行为。它是一种外交行为。一种地缘政治表态。


    ) F( n- n: N% H* Z0 r# ^" ^

    第二层:AI超级计算机与数据中心(混凝土)
    ; [& |# e/ [. R) O: g

    一旦你有了芯片,你需要把它们放进一个能运行的地方。


    & M" u+ n: G- `

    AI超级计算机不是普通的服务器机房。一台用于训练前沿模型的AI集群,其物理要求令人眩晕:

    6 T7 D9 V$ f# n6 a

    • 电力:一个一万块H100的集群,满负荷运行时消耗约7到10兆瓦——相当于一个小型城镇的全部用电量
    • 冷却:空气冷却已经不足以应付这种热密度。液冷正在成为标配——直接芯片冷却(direct-to-chip cooling)或浸没式冷却(immersion cooling)
    • 网络:训练时GPU之间的互联速度是决定性瓶颈。NVIDIA的NVLink和InfiniBand提供了每秒数太字节的GPU间带宽——没有这些,你的十万块GPU就只是一堆各自为政的加热器
    • 建筑:AI数据中心的天花板高度、地面承重、消防安全标准与传统数据中心完全不同。在美国,每月数据中心建设支出从2022年的约20亿美元飙升到2024年的超过250亿美元
      / U4 N" K! Q# J
      1 }' y" l3 Y( I& n( w6 e1 [% C; d

    对于大多数国家来说,建设这样一个级别的AI基础设施在物理上是可行的——但需要5000万到数亿美元的投资,以及与NVIDIA、数据中心建设商、电力公司的复杂协作。

    $ [% U9 U6 W+ c* M

    英伟达把AI数据中心称为"AI工厂",这个说法很准确:它们不再是传统的IT基础设施,而是类似于钢铁厂或发电厂的国家战略资产


    # r' f. M7 H' M: H0 {# U# R" M5 ^# y

    第三层:基础模型(代码)( |3 a" [  E( V- K! B

    这是构成当前AI能力核心的大型神经网络。

    & i6 O0 l$ y- U

    从零训练一个前沿大模型——不是基于别人的开源模型微调,而是从随机权重开始、用自己的数据从头训练——这是主权AI的"最高境界"。但它也极其昂贵:

    • 硬件成本:至少数千万美元,通常数亿美元
    • 技术门槛:你需要有大型分布式训练系统经验的工程师——这是一群全球只有几千人的稀缺物种
    • 数据要求:你需要数万亿个高质量token的训练数据——这意味着你需要在全世界范围内抓取和清洗网页数据,或者拥有一个庞大的自有数据资产
    • 能源消耗:训练一个前沿模型可能消耗数千万到数亿千瓦时电力! `6 l) m+ e5 V  ^3 l- b* R
      0 j: W$ G8 Q6 q% W- S  H. I1 g, |

    因此,在实践中,"模型主权"有三个梯度:

    • 全主权:从零训练,全栈自有(成本最高,适合拥有强大算力和人才储备的大国)
    • 半主权:基于开源基础模型(如Llama、DeepSeek、Qwen)进行大量领域适配和再训练——保留架构理解和对数据的完全控制,但不承担从零训练的全部成本
    • 微调主权:在现有模型上添加本国的语言数据和文化知识——成本最低,适合资源有限的小国. w2 t+ F  m0 @+ G9 z* h
      . N) r/ r0 Y" x* T( [$ F2 J) ]

    这三种梯度之间的边界正是全球主权AI辩论中最激烈的技术争论之一。韩国的Naver Cloud因为在国家代表AI项目中触碰了"外部模型组件"这条红线而出局,就完美地说明了这一点。


    * X+ [3 w- a7 a4 g; ^# |# C% p' \

    第四层:应用程序与服务(界面)
    ) }0 b$ s/ [2 U+ N: n

    这是主权AI的"最后一公里"——AI模型如何进入公民的日常生活。

    在这一层,主权关心的不是模型本身,而是:

    • AI驱动的政务服务是否将公民数据发送到境外服务器?
    • 国防系统中的AI组件是否经过独立的安全审查?
    • 教育AI是否用本国的语言、文化和价值观来与学生互动?
    • 医疗AI的诊断建议是否基于本国的流行病学和药物可及性数据?4 m  I7 n9 k9 m& x" D
      ( r% p5 ?% R( j4 l2 U1 ?, ]$ t& o

    英国的主权AI策略在这个层面提供了最有启发性的案例。英国政府或许没有能力或意愿从零训练一个对标GPT-4的模型——但他们建设了全球最先进的国家级AI安全测试基础设施。英国AI安全研究所(AISI)的定位是:我们不训练最好的模型,但我们有能力验证任何部署在关键系统中的模型是否安全。

    这是一种不同维度上的主权——不是"建设权",而是"验证权"。

      o$ \' a& U: k+ t9 W( M  {! K# k- J

    第五层:制度与治理(规则)1 o0 n& W& T$ G

    最后一层不是技术,而是法律、制度和标准。


    2 i+ c1 T) u" o; k2 n( H

    当你有能力制定规则时,你就不需要凡事亲力亲为。

    % W) e+ {3 c  q6 r1 D

    欧盟AI法案是全球第一个全面的AI监管框架。尽管它的批评者——尤其是硅谷的批评者——将其描述为"欧洲在AI竞争中落后后的防御性立法",但事实可能恰恰相反。通过设定全球最严格的AI合规标准,欧盟正在创造一个"合规护城河":如果一家AI公司不能通过欧盟的合规要求,它就无法进入拥有4.48亿高购买力消费者的欧洲市场。

    而"无法进入欧洲市场"——对于一个面向全球部署的AI产品来说——意味着在全球最大的几个市场中缺席。

    " m  u9 H* p, E. y+ i9 Q3 C) @

    制度主权靠的正是这一套打法:用规则代替资本,用标准代替算力,用合规要求代替技术优势。 在这场游戏中,谁制定规则,谁就拥有解释权,而解释权有时比模型本身更硬。

    ---

    / [/ ]: T1 O5 z1 I

    第六章:破局者的七张面孔——全球主权AI版图速览
    * W+ E0 `+ e% L& |" G# d$ s% p. c

    在过去的五章中,我们建立了一个分析框架——一个从沙子到智能的垂直堆栈,一种从依赖恐惧到公平危机的驱动力图谱。接下来,我们将这个框架应用到全球版图上,看到的是一个令人着迷的多样性全景。


    , }4 Q+ Y1 [/ a$ o

    虽然每个国家都在谈论"主权AI",但它们各自的主权概念、实现路径和核心焦虑截然不同。以下是对本系列后续七篇的路线图预览。

    欧盟:合规护城河与公共AI大基建0 L! E  V( w2 V2 m5 L, X

    欧盟的主权AI故事是三线并行的。

    7 t( Y* Q5 {% m/ v3 B; Q

    第一条线是欧盟AI法案——一个重塑全球AI合规标准的规则体系。它可能比任何单一的AI模型都更有全球影响力。

    # A2 _& E' V# w3 M  @

    第二条线是分散但多产的欧洲基础模型生态——法国的Mistral(60亿美元估值),德国的Aleph Alpha(强调可解释性),西班牙的ALIA计划(100%公共资金),以及欧洲超算联合体(EuroHPC)构建的公共算力基础设施。

    ' h+ b- _: @' A  V0 i& n7 {

    第三条线是欧洲特有的焦虑——一种"数字殖民地"恐惧:欧洲消费者用美国的搜索引擎、美国的社交媒体、美国的云服务、美国的AI模型。欧洲的创新者在旧金山和北京之间寻找第三条路。

    ! x# U8 I3 g* ^. E/ I& ^

    法国的Xavier Niel——电信亿万富翁——投入3亿欧元创建了开放科学AI实验室Kyutai,其Moshi语音模型以极低延迟令人惊叹。但这笔投资与微软每年超过800亿美元的AI资本支出相比,就像用刀对抗坦克。欧盟的主权AI之路是一段"在约束中寻找自由"的受难史。

    + H3 J4 a: `4 x4 L% K

    亚洲突围:算力受限者的边缘创新
    ! h5 V) q! p! i4 _" x/ u+ u

    日本、韩国、台湾——三个截然不同的故事,但共享一个主题:如何在一个被算力巨头定义的游戏里,找到你自己的规则?

    日本的故事关于"边缘创新"——Sakana AI利用演化计算和模型融合,在没有海量GPU的情况下实现了突破。"Attention Is All You Need"的合著者Llion Jones,现在正在东京书写着"自然启发AI"的新篇章。


    , `) z; m3 T8 {3 A: }

    韩国的故事关于"技术洁癖"——韩国国家代表AI项目的争议焦点,是老牌巨头Naver Cloud因中国Qwen视觉编码器组件被判不符合"独立AI"标准。这不仅是一个技术选择,也是一种地缘站队。


    2 o1 W% t+ o  e0 W. @& m

    台湾的故事关于"语言主权"——TAIDE模型不仅是为了让AI说"台语",更是一种"价值对齐"的实验:如何让AI反映一个只有2400万人口、但在全球芯片供应链中占据关键位置的社会的独特文化立场?

    ; s8 W. g9 u2 L; W$ E0 a  D  H9 o

    中东:石油资本的算力绿洲  T" [; i- P# }( M

    如果主权AI需要一个"大力出奇迹"的版本,中东就是答案。


    9 F+ r4 M$ \+ O

    沙特阿拉伯将2026年定为"人工智能年"。阿联酋建立了全球第一所AI研究生大学(MBZUAI),任命了全球第一位AI部长(Omar Al Olama,任命时年仅27岁),并孵化了从Falcon到Jais一系列令世界震惊的开源模型。

    ) y+ T! L3 q7 v% ?: K5 d6 m

    但最令人着迷的故事来自G42——这家阿布扎比主权财富基金支持的AI公司。2024年4月,微软向其投资15亿美元。但这笔交易的隐含条款是:**G42必须切断与所有中国科技公司的联系。**美国商务部长吉娜·雷蒙多亲自参与了谈判。

    # l4 `9 c) n% ]: }6 T

    这个故事浓缩了主权AI的所有地缘政治矛盾:一个中东国家的主权AI公司,受制于美国的外交要求,向中国说"不",然后拿着美国科技巨头的钱在全球扩张。

    ( Q6 D3 S8 ^/ m2 z

    英国:用"验证权"重新定义主权
    6 q2 L/ H: h2 |0 `* |' Z

    英国没有从零训练自己的前沿大模型——但英国拥有全球最先进的国家级AI安全测试基础设施。

    ; }  s9 q9 D7 o6 X0 j  Z( [

    英国的逻辑是这样的:算力和数据的本土化,不等于安全可控。 如果你的医院、你的电网、你的国防系统中运行着一个外国AI模型,你真正需要的不是自己训练一个替代品——你需要的是能够独立检验和验证那个外国模型的能力。


    ; S; h1 {+ [0 L1 o  t% F

    "AI Safety Institute"(后更名为"AI Security Institute")就是这个逻辑的制度化身。它打开了一个全新的主权维度:不在于"你造不造得了",而在于"你查不查得了"。

    印度:以开源之名,行语言正义之战
    ; j7 l+ f) |( R$ ]% T- I8 H

    印度拥有22种官方语言、上万种方言、数十亿未被AI代表的母语者。从萨瓦姆AI(Sarvam AI)的小型高效模型,到AI4Bharat实验室的开源印度语模型矩阵,再到政府主导的"印度语翻译使命"(Bhashini),印度正在用开源力量和数字公共基础设施(DPI)哲学,打一场全球独一无二的语言普惠战争。

    : n4 x$ q/ S5 [: S8 q. Y5 C. \) d

    印度没有试图在"规模"上与OpenAI竞争。它的主权AI之路是另辟蹊径的:用公益精神代替商业主导,用语言覆盖度代替参数规模,用数字包容代替技术前沿。

    小国大生态位:新加坡与瑞士的"信任溢价"& `9 P& K* ?) N' r

    人口560万的新加坡,凭什么成为整个东南亚的AI枢纽?答案是:新加坡不做通用大模型。它做的SEA-LION模型覆盖了东南亚十多种语言和方言——包括闽南语、潮州话这些被主流AI完全忽视的"方言"。新加坡把自己打造成了东南亚AI生态的"分发节点"。


    $ E. X7 M8 G2 U7 W% U

    瑞士的故事则更富有哲学意味。瑞士联邦理工学院(ETH Zurich和EPFL)发起的"瑞士AI倡议",其Apertus模型被明确标注为"完全透明"——训练数据、训练代码、模型权重全部开放。瑞士正在将其中立、精确、可信赖的国家品牌,从钟表和银行业移植到AI领域。

    这两个小国的共同策略是:不追求全能,只守住一个别人绕不过去的位置。 对中小国家来说,这比复制大国全栈更现实。

    0 }5 P' t* Z# F. {/ k: ^

    中国:全栈基建狂魔与"掐脖子"突围——作为终章6 y) x( ~5 k2 Y

    最后——当我们遍历了全球所有其他主权AI的模式之后再回到这里——中国的故事将呈现出不同的面貌。


    / x) Q5 w" k: ]+ x/ p

    中国是世界上唯一一个正在系统性构建全栈AI主权——从芯片设计到基础模型,从操作系统到开发者生态——的国家。这是被逼出来的。自2022年10月美国实施第一轮AI芯片出口管制以来,中国面临着全球最有针对性的技术封锁。华为昇腾芯片成为唯一的国内选项,DeepLink和FlagScale框架正在缝合异构的国产芯片生态,"鹏城云脑Ⅲ"正在成为一个国家级的算力大动脉。

    # d& M2 O7 b( Y& L6 I+ K" ~6 e

    但中国的故事不仅仅是"在封锁下求生存"。它也是一个关于制度能力的故事——"举国体制"如何在应对系统性技术挑战时展现出独特的优势。2025年1月DeepSeek-R1的发布,以及DeepSeek-V3技术报告中约557.6万美元训练算力成本的披露,彻底颠覆了"没有最先进的芯片就造不了最先进的AI"的认知。华尔街为此动荡了一天。英伟达市值一天蒸发近6000亿美元。


    . x" |" A# x) b! t

    将中国放在最后,不是因为它的故事最不重要——恰恰相反。是因为只有在理解了其他所有国家"为什么做不到"之后,你才能真正理解中国"为什么必须做到"。 中国的全栈突围不是一种策略选择——是所有其他选项都被封锁之后剩下的唯一一条路。

    ---

    在接下来的七篇文章中,每一篇都将沿着四条主线拆解一个国家的故事:

    • 算力从哪里来?——自建超算?商业云租赁?国产芯片?能源结构?
    • 钱从哪里来?——国家拨款?主权基金?VC私募?外资?谁的钱有附加条件?
    • 技术怎么走?——从零训练?开源微调?模型融合?"纯血"技术路线还是务实"拿来主义"?
    • 最怕什么?——每个国家选择的主权AI路径,通常都能回到它最深的恐惧。3 }# A- C9 ?* B! R' X/ i+ G2 S

      , D) @# K4 @! t4 V

    这四条线不是用来比较"谁更好"的。它们用来揭示每个国家的制度性格——主权AI策略往往是一个国家最深层的战略文化在技术维度的投射。

    ---

    - H5 |$ t/ m0 r2 G6 [

    终章:七十条线
    . B4 k% Q4 P0 c) I$ v& {

    2026年6月。欧盟正在就《云和AI发展法案》(CADA)做最后协调。全球70多个国家已经发布了AI战略。NVIDIA市值在3万亿美元上下振荡,一个季度卖出的GPU总值超过大多数国家全年的军费开支。全球AI年度投资正冲向3000亿美元。

    : H% {1 o4 Y7 V( l- {, U% r9 V  @( V

    "主权AI"已经从Jensen Huang的推销词变成了外交辞令、变成了国家预算科目、变成了产业战略白皮书封面标题。

      K% V* I& F' F5 A1 b

    但它的内核从来没有统一过。

    / T) x- p" V7 A! L4 O

    对中国来说,主权AI是活下来——在芯片封锁下维持AI能力的底线,然后找机会反超。 对欧盟来说,主权AI是立规矩——既然无法在模型层面竞争,那就让所有模型遵守统一的合规标准——而合规标准由欧洲来写。 对英国来说,主权AI是查账权——我不建模型,但我能检验任何部署在英国关键系统中的模型是否安全。这是一种用"审计权"替代"建设权"的主权。 对沙特和阿联酋来说,主权AI是买门票——石油美元换算力美元,用"别人没有的资本密度"购买AI大国的入场券。 对印度来说,主权AI是语言正义——22种官方语言、上万种方言的十亿人不能被英语AI无声地抹掉。 对日本来说,主权AI是绕道走——算力拼不过,就在算法层面找弯道。演化计算、模型融合、蚂蚁算法——只要能避开GPU军备竞赛。 对新加坡来说,主权AI是分发权——560万人的国家不为通用AI竞争,但可以成为6.8亿东南亚人的AI分发节点。 对瑞士来说,主权AI是信任溢价——最精确、最开放、最中立——用国家品牌换取全球隐私敏感领域的不替代地位。

    9 l2 d+ |; b6 l8 d1 S% O. K

    Jensen Huang至少在一件事上没有说错:每个国家都应该有自己的AI。


    & M/ }( B  T6 ?; p

    但"拥有自己的AI"——这七个字,摊到全球七十多个国家和数百种语言和文化面前,意味着七十多条完全不同的路径。有些是高速公路——砸几百亿美元、调动全国家机构、从沙子到应用全栈铺设。有些是步道——几个研究员、一台开源模型、一个社群的数据众筹。有些甚至是地道——在封锁线的缝隙中找到别人看不见的通道。

    ) s3 {0 q) o+ d' }) K; l3 a) L2 r

    但没有一条路是免费的。 每一块GPU都跟着一份出口管制文件。每一笔投资都附带着一个地缘政治立场。每一个训练数据选择都是一个文化表态——你说"AI说我的语言"的同时,也在说"我的语言值得被AI记住"。

    这个系列的每一篇文章,都在讲一条这样的路。它不急着判断哪条路正确,因为在这个分裂的时代,真正的问题没有标准答案:

    当世界被硅谷和北京的代码重新绘制时,你的边界还由你来定义吗?

    4 }6 _% j  |/ u

    有些国家用算力回应,有些国家用法案回应,有些国家用语言回应。还有些国家选择沉默,而那种沉默本身也像一句话:我不玩你的游戏。

    但不管是哪一种回应,有一件事已经不再需要讨论了:全球AI的默认时代结束了。


    " s- C3 {3 E3 V3 N) s) h( H

    你不再可以不选边。即使你选了"中立",那只是一种更加昂贵的选边。你不再可以使用"通用AI"——因为接下来的世界,只有"你的AI""我的AI"和"他们的AI"。你不再可以假设"技术无国界"——因为芯片上有制裁编号,云上有司法管辖权,模型里有价值观审查。技术从来都有国界,只是以前不需要你在合同上签字。


    ( X. O/ R/ a/ ~. N9 E; N

    七十多个国家已经开始签了。


    ; Z) S( f) a$ g9 D! b

    接下来的七篇文章,就是他们的签名。

    ---

    下一篇:《欧盟篇——数字主权焦虑与规则护城河的建构》


    ' j, H1 U9 F) `( c9 G. M9 I; N1 |. X3 ]' y% a- z  R9 l' l
    4 V# A6 W0 ~( n8 _* y

    评分

    参与人数 6爱元 +60 学识 +2 收起 理由
    pcb + 6
    忧郁金桥 + 6 有您,爱坛更精彩
    helloworld + 10
    老票 + 18 + 2 精彩
    黑洞的颜色 + 10 谢谢分享

    查看全部评分

  • TA的每日心情
    开心
    2020-1-2 23:51
  • 签到天数: 2 天

    [LV.1]炼气

    沙发
    发表于 6 天前 | 只看该作者
    5 |& `( A" e) w0 }: j8 g" z7 X
    很有启发性,期待教授的鸿篇巨制。" l- M" p$ j! s3 H

    ) Q2 G, Q1 ~0 h: S: B
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    奋斗
    16 小时前
  • 签到天数: 1356 天

    [LV.10]大乘

    板凳
    发表于 6 天前 | 只看该作者
    挑个刺,文中实质性把台湾当成了一个”国家“来描述。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2020-4-8 10:45
  • 签到天数: 227 天

    [LV.7]分神

    地板
     楼主| 发表于 6 天前 | 只看该作者
    leekai 发表于 2026-6-16 16:29
    % {3 l) I+ N1 A" w$ b挑个刺,文中实质性把台湾当成了一个”国家“来描述。
    2 G& e' j4 v. B* c9 C) h
    这也许就是为啥公号发不出来的原因吧。
    - ?. o, z: D+ g4 g+ R, H9 ~
    , A5 d* |  L5 w- S: j0 t( _反正是写着科普的,也懒得再大范围修改了;东亚篇的内容我直接去掉了台湾,放在晨大的帖子后面了。; \/ C! k3 ~) S2 B- Z" w
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    奋斗
    16 小时前
  • 签到天数: 1356 天

    [LV.10]大乘

    5#
    发表于 6 天前 | 只看该作者
    xiejin77 发表于 2026-6-16 20:515 I1 }( U* \2 C7 Q- a2 C1 P
    这也许就是为啥公号发不出来的原因吧。
    1 Q0 B% l5 F+ l! c  l
      Q6 q, X* n- Z5 a  T: C4 o) H( c反正是写着科普的,也懒得再大范围修改了;东亚篇的内容我直接去 ...

      [) E* _. {$ I; J2 s应该是的。大陆对台湾、内地对香港,这些年执行挺到位。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2020-4-8 10:45
  • 签到天数: 227 天

    [LV.7]分神

    6#
     楼主| 发表于 5 天前 | 只看该作者
    本帖最后由 xiejin77 于 2026-6-17 13:42 编辑
    2 x$ I) }% i% Z8 {( ^: r( {5 |8 a# o$ A+ M* B6 m
    欧盟篇——造不出GPU,就先写规则( a, e5 {, [5 F5 i3 S, ?2 x

    ! c! W- P; {0 I6 G6 m8 n

    系列:《全球主权AI实验室巡礼——在大国博弈中寻找"破局者"》 第二篇 | 欧盟篇

    2 r. ~6 A7 N* a/ |1 K' H


    引子:出卖4 t" T: O' F; A  A7 G
    + v" o! O4 g1 b2 p8 h

    2024年2月26日。巴黎。


    - g  k" P: G( [. [

    Arthur Mensch站在Mistral AI办公室的白色投影幕布前,一件白T恤,一件休闲西装外套。他今年31岁。十个月前,他和两个联合创始人——Timothée Lacroix和Guillaume Lample——在巴黎成立了这家公司。三个人都是前DeepMind和前Facebook AI Research的研究员。他们刚刚做成了欧洲历史上最大的一轮种子融资:1.05亿欧元。到2023年12月,估值已经冲到20亿美元。法国媒体称他们为"欧洲的OpenAI"。


    8 }1 p1 a4 X( `! @6 c2 r* z

    今天他宣布了一件事。

    & C2 Y) k' S6 P: U/ a$ J) }1 m

    微软——这家被欧盟《数字市场法案》认定为"守门人"的科技巨头——向Mistral投资了1500万欧元。这笔投资将在下一轮融资中转换为小额股权,按当时估值计算占比不到1%。Mistral的模型将被部署在微软Azure云上。


    & j6 f1 h5 |2 x: i3 v7 g0 g

    1500万欧元。在AI世界里,这是一个可以忽略不计的数字。OpenAI从微软拿走了超过130亿美元。Anthropic从亚马逊拿走了80亿美元。1500万欧元对于一家估值20亿美元的公司来说,是小数点后的尾数。


    2 t) \1 ^0 Y7 e  [- H

    但接下来的48小时,法国科技媒体、欧洲议会议员、布鲁塞尔的政策圈同时炸锅了。

    # ]4 @' q- K* R6 o" W

    一位法国社会党欧洲议员对Politico说了一句话,像刀子一样精准:"我们为Mistral在AI法案谈判中打了仗。他们告诉我们他们是欧洲的冠军。现在我们发现微软持有他们的股份。这是一种羞辱。"

    & u- B7 x: a9 l2 A0 k$ P2 u. @

    另一位跨党派议员团体的成员说得更直接:"这不是出卖了公司。这是出卖了通路。欧洲的政治资本被用来保护一家公司,然后那家公司在后门口给微软留了一把钥匙。"


    5 a4 I( T- M" q

    Arthur Mensch的回应是工程师式的平静:"这是一个商业伙伴关系。我们保持独立。我们的模型仍然是开源权重的。微软的股权是最小化的。而且坦白说——如果欧洲想要主权AI,它必须先建设主权算力,而不是抱怨企业在获取任何可用的算力。"

    2 p: k9 m- R5 j/ R

    这句话——"如果欧洲想要主权AI,它必须先建设主权算力"——是整个欧洲主权AI故事的核心矛盾。他说的完全正确。而他说这句话的那一刻,也同时暴露了为什么"完全正确"恰恰是欧洲AI主权困境本身。

    0 I4 b" @* E! U" |

    因为欧洲可以制定全球最好的AI法规。它可以培养世界一流的AI研究人员。它可以孵化估值数十亿的AI独角兽。但它没有足够的GPU来支持这些公司独立训练下一代模型。


    ; w4 A0 f) y- y

    欧盟主权AI的困境就在这里:法规是世界上最严的。人才是世界上最密的。历史根基是世界上最深的。但当你需要三万块H100来训练下一个模型时,你只能拿起电话,打给西雅图。



    * I4 @1 X! E: J2 O5 o1 P9 {
    第一章:殖民地焦虑——从一个词到一种国策: T  H! [# Q5 {  X

    $ U- W4 E9 g: c/ E# g

    要理解欧洲在AI领域的全部行为——从GDPR到EU AI Act,从GAIA-X到InvestAI到CADA——需要先理解一个词。这个词不是"主权",不是"创新",不是"竞争力"。这个词是 "数字殖民地" 。


    / ]* F% P1 U) g" S' R! Y

    一个创伤的谱系
    - `3 m. N) V& `0 n% A

    2013年。Edward Snowden的披露揭示了一个让欧洲比美国更震惊的事实:不仅仅是NSA在监控全球——是美国的科技公司在充当NSA的数据管道。Google、Facebook、微软、苹果——所有这些欧洲消费者每天都在使用的平台——其服务器同时也是美国情报机构的延伸。

    - O/ h* r8 ~2 O$ s' i4 T9 ?8 j

    问题早已超出"隐私"本身,落到了基础设施所有权上。如果一个国家的公民数据全部存储在另一个国家的公司服务器上,而这些公司受另一个国家法律的强制要求配合其情报机构——那么在什么意义上,这个国家拥有"数字主权"?

    : y9 {, j& S0 U3 C# R

    2018年,GDPR生效。2019年,德国和法国共同发起了GAIA-X——一个旨在建立欧洲自主云基础设施的宏大项目。德国经济部长Peter Altmaier在发布仪式上说:"我们正在建立一个数字化生态系统,在其中数据和服务将被安全地存储和处理——不受外国控制。"

    + D" g% R1 K/ b6 B1 Y$ {

    七年后的2025年,GAIA-X的现实是什么?一位参与过该项目的德国官员私下说:"七百页文件。没有一台服务器。"

    6 @; e; C9 R( m. c

    GAIA-X没有死。它产生了一系列云服务互操作标准——联邦身份验证、数据控制、服务目录。但它仍然没有解决最根本的问题:当一家欧洲AI初创公司需要训练模型时,它不是在GAIA-X的互操作标准上训练——它是在AWS的裸金属GPU实例上训练。因为那是唯一有足够规模的选择。

    ! |% ~9 g7 d3 \5 e1 k4 [

    GAIA-X的命运几乎浓缩了欧洲数字主权的困境。它的孵化期——2019年到2021年——恰好是欧洲政策语言中最密集地出现"主权""自治""第三极"等词汇的时期。德国经济部长Peter Altmaier和法国经济部长Bruno Le Maire共同宣布了它。默克尔和马克龙都亲自背书。它的目标清单读起来像一篇主权独立宣言:建立欧洲自主的云基础设施;为欧洲公民数据提供不受美国法律管辖的存储和处理环境;创造欧洲云服务商的开放市场;用互操作性标准让欧洲公司可以自由切换云提供商而不被锁定。


    ( G. ^$ O0 x" R/ S1 ]

    到2021年底,GAIA-X已经产生了数百份技术规范文件。到2023年底,它已经签约了数百家欧洲中小企业作为"节点"。到2025年——它的第七年——它仍然没有一台自己所有的服务器在运行AI训练工作负载。

    & U- Y9 A: w) ]9 J

    一位参与GAIA-X架构设计的德国工程师在2024年的一次闭门研讨会上说了一句流传甚广的话:"GAIA-X解决了一个没有人有的问题。它让欧洲的云服务可以互操作——但欧洲没有云服务需要互操作。我们在为一座不存在的城市设计交通规则。"


    6 e! A+ L% L+ M9 s' W3 o

    这句话残忍但精确。GAIA-X的核心设计理念——联邦化、互操作、开放标准——是技术上一个优雅的解。但它解答的问题("如何让多个欧洲云服务商无缝协作")有一个前提条件("存在多个有竞争力的欧洲云服务商"),而这个条件本身就是一个未被满足的前提。OVH、Scaleway、Ionos——它们加在一起的云收入可能不到AWS的3%。


    + B5 t0 \& b% S8 C% \/ A1 Y& s* S

    GAIA-X不是失败在技术上。它失败在它试图用一个软件方案来解决一个硬件问题。


    4 ?- W% @$ T8 ^5 ^* v

    一位委员的哀鸣
    & u7 a. S0 J. E! P6 u

    欧洲的"数字殖民地"话语中最激烈的声音来自Thierry Breton——2021年至2024年担任欧盟内部市场专员。他曾经这样说:"我们不能继续做美国和中国的一个数字殖民地。如果我们不建立自己的数字基础设施,我们将沦为一个为别处设计的、由我们未曾参与的规则统治的技术的消费市场。"


    ( i: D! {& H2 q0 g

    Breton的这句话之所以特别有分量,是因为他不是一个左翼活动家——他曾经是法国电信和Atos的CEO。他是一个工业家。他知道基础设施是怎么建的。他也知道欧洲没有建多少。


    % f3 s4 r4 a2 b0 f" n4 e

    但最令人心痛的不是Breton的愤怒。是他离开欧盟委员会的方式:2024年9月,他写了一封公开辞职信,公开指责冯德莱恩的"可疑治理方式"。这位欧洲数字主权最激进的捍卫者,不是因为政策失败而下台——而是因为内部政治。

    & L6 P) j7 j" N" X" w

    一个数字的真实分量8 i, s) V( y. m0 [. S" C! b

    三组数据可以概括欧洲的数字殖民地焦虑的全部现实:


    & Z+ M8 |. I3 ~- D1 Q- R( g' J! p

    • 欧盟云计算市场约65%-70%的份额由三家美国公司持有——AWS、Azure、Google Cloud。欧洲本土云服务商(OVH、Scaleway、Ionos、T-Systems)合计不到15%。
    • 欧洲AI私人投资占全球约8%——美国约55%,中国约20%。欧盟的总AI投资不到美国的六分之一。
    • 超过80%的欧洲公民数据存储在由美国法律管辖的服务器上——无论是通过GDPR合规条款、欧洲数据中心"区域"(AWS法兰克福/Azure爱尔兰),还是通过简单的跨大西洋数据流。4 R9 X3 V2 m' U* Z! W
      8 W+ V, ?8 V7 Q4 V4 W* |) F


    ! G1 x; |- |) {* P% x4 h

    当欧盟政客说"数字殖民地"时,他们不是在比喻。他们是在描述一个他们每天在统计数据中看到的权力关系。


    ; j7 N8 ^0 g% K- i) s


    第二章:用规则替代算力——EU AI Act的野心与局限
    + j  N% j# w3 w

    如果说欧洲在AI基础设施上落后美国一个数量级,那么它在AI监管上的领先至少是同一个数量级的。


    + ~* q6 d3 @/ L1 [

    全球最严AI法规的诞生7 }0 M# b% O" h, F' k

    2024年8月1日,《欧盟人工智能法案》(EU AI Act)正式生效。这是一部由113条正文和13个附件组成的法律,从提出到通过历时三年半,是全球第一部全面的、跨行业的AI监管框架。

    " v7 @# m3 O4 O2 t) [6 @$ s, @

    它的核心逻辑是一个四级风险金字塔:

    ' u/ Z  z, R5 y$ K2 a

    • 不可接受风险(禁止):政府运营的社会评分系统(明确针对中国模式)。公共空间实时生物识别。潜意识操控。
    • 高风险(严格合规):在医疗设备、关键基础设施、教育、就业、执法、边境控制中使用的AI——必须通过合规评估,必须注册到欧盟数据库。
    • 有限风险(透明度义务):聊天机器人必须说明自己是AI。深度伪造必须标注。生成式AI必须披露训练数据的版权摘要。
    • 最小风险(无监管):绝大多数AI应用。" n. N* i) P( q) z8 I5 Y/ O
      # }9 X# d# U4 U6 f( ^8 ]


    1 u) q' b0 q& B- L$ }% Q: \

    罚款的上限是3500万欧元或全球年营收的7%——取两者较高值。一个总部在旧金山的AI公司,如果其模型在欧洲被使用,就要遵守这部法律——不管它是否有办公室在布鲁塞尔。这是"布鲁塞尔效应"(Brussels Effect)在AI时代的首次规模化应用:欧盟通过设定高合规门槛,迫使全球公司按照欧洲标准运营。

    "我们造不出,所以我们管"
    7 B% P# e8 l0 c: ~) q/ L

    EU AI Act的批评者——特别是在硅谷和美国国会——有一种统一的批评调门:欧洲在AI竞赛中落后了,所以它试图通过过度监管来"玩规则牌"。 "当你的对手在赛跑时,你在往赛道上铺减速带。"


    2 q: F1 m2 K$ x$ ]7 [+ E

    这个批评不完全公平,但它捕捉到了EU AI Act不可否认的一种驱动力:当你的AI建设能力与你的AI消耗体量之间的差距变得大到不可忽视时,"制定规则"就变成了你能用手中的唯一工具去争取的、像"主权"一样的东西。

    但这个批评常常漏掉一层背景:EU AI Act并不是在AI竞赛开始之后才起步的。它的种子,是欧盟第一次感受到"规则可以塑造市场"时播下的。

    2018年,GDPR生效。全世界——包括硅谷——嘲笑它是一部过度官僚的、反商业的隐私法规。但到2023年,GDPR已经产生了超过40亿欧元的罚款——Meta一家就被罚了超过20亿欧元。而全球已有15个以上的国家以GDPR为模板制定或更新了本国的数据保护立法。加州消费者隐私法案(CCPA)的前身就是GDPR。印度2023年的《数字个人数据保护法》大量借鉴了GDPR框架。"布鲁塞尔效应"并不是欧盟发明出来的一个推销概念——它是在欧盟不知不觉中已经发生的事实。


    ) W" \; X0 `7 X# R8 b1 j

    EU AI Act的目标是复制GDPR的成功路径:先在本土建立一个高标准法规,让全球公司在"遵守欧盟法律"和"放弃4.48亿高购买力消费者"之间做选择——然后等着世界其他地区拿这个法规当模板。

    * V; ~/ i; k3 m) }. G! Q

    委员会内部有一份从未公开发表但被多方引述的战略文件有一句话说得很直白:"在AI领域,欧洲不能靠规模竞争。我们必须靠规则竞争。"

    ' G, v7 \- f; s3 e$ B2 [) i! V

    谁在付账?谁在抗议?
    / E% J+ m3 J( a! f2 T7 e( L

    EU AI Act在立法过程中经历了几次重大的游说战役。


    $ |+ ?& T5 D, r, Z+ L2 |1 m

    最大的冲突发生在2023年底的"三对谈"(trilogue——欧洲议会、欧盟理事会和欧盟委员会的三方协商)期间。核心争议是通用AI模型(GPAI)是否应该受到专门监管。法国、德国和意大利——欧盟三大AI国家——联合提出了一份反对文件,主张对"基础模型"的监管应该用宽松的自律准则而不是硬性的法律义务。


    ; z3 R, a* D5 b

    他们的理由很实际:Mistral(法国)和Aleph Alpha(德国)——欧洲自己的AI冠军——如果受到过度的合规要求,将在与OpenAI和Google的竞争中处于劣势。 "我们不应该在起跑线上就对我们的公司实施监管,而对从美国进入市场的公司只是要求他们在进入后遵守规则,"一位法国官员在闭门会谈中这样说。


    . B% V; g, E' B! [$ b; _3 ]

    最后达成的妥协很微妙:GPAI模型确实被纳入了EU AI Act的管辖范围,但更严格的安全和风险评估条款主要适用于"系统性风险"的GPAI模型——即那些使用超过10^25 FLOPs训练计算量的模型(这是GPT-4级别及以上的标准)。这意味着欧盟的法律在保护"小公司"(所有欧洲AI公司都是小公司)和约束"大公司"(所有硅谷巨头都是大公司)之间划了一条微妙的线。

    ) c- A0 [2 f! N0 Z7 l* L6 e3 D

    这条线本身就是一种公开的政治表态:欧洲立法者把"你太大了不能不被监管"写成了技术阈值。而这个阈值——至少在2025年——只有美国公司跨得过。

    合规护城河的两面+ N" e8 g: d3 @+ D! }

    EU AI Act在创造一种历史上从未有过的市场壁垒:合规壁垒


    % [0 u( I* _# c* R( |' ~6 c

    一个AI公司要从零开始满足EU AI Act的要求,需要在法律团队、合规评估、风险审计、数据溯源、透明度文档等方面投入数百万到数千万欧元。这本身就是一种进入成本——而能够在没有本地化团队支持的情况下承担这个成本的,只有最大型的美国和中国AI公司。小型的外国初创公司直接被挡在门外。


    + e6 O" t2 B' k5 \1 [" E

    但同时,这个壁垒也是一把双刃剑。它保护了欧洲AI公司的本地市场空间——但同时也给欧洲AI公司增加了同样的合规负担。一家德国AI初创公司——Aleph Alpha——为了确保其政府客户可以合规使用其模型,不得不建立了一个庞大且昂贵的安全与法律合规部门。这笔钱如果花在GPU上,也许已经多训练一代模型了。


    - n6 u# z% i* ~+ m" d1 U- ^* P

    合规护城河给了欧洲AI公司一个生存空间——但也给了它们一个天花板。


    ) s3 U/ Q. `/ J5 i$ Q2 Q



    7 _5 l7 r2 b9 Y) `, K
    - j9 h2 {4 V9 I
    第三章:法国——开源奇迹与算力匕首
    2 c* R, |2 F, p6 B( q

    法国是欧洲主权AI最焦灼的战场。因为法国有欧洲最好的AI人才,有欧洲最大胆的AI投资愿景,有欧洲最激进的"第三极"政治叙事——但它仍然在所有关键层面受制于大西洋彼岸的算力供给。


    2 g) P6 {$ T9 K. g  j

    Kyutai:八位研究员的奇迹
    ) D2 n/ o, {2 `" I

    2023年11月,法国亿万富翁Xavier Niel——Iliad电信集团的创始人——在巴黎宣布成立一个新的AI研究实验室:Kyutai。初始投资:1亿欧元。联合出资人:CMA CGM集团(全球第三大航运公司)的Rodolphe Saadé,以及谷歌前CEO Eric Schmidt的Schmidt Sciences基金会。总启动资金池:3亿欧元。


    ) Y: Z$ c! z3 [+ }# @

    Kyutai是一个非盈利、开放科学的AI实验室——它的直接对标不是OpenAI,而是早期的DeepMind。它的团队不到30人——其中核心研究员不到20人,包括来自Facebook AI Research(FAIR)和Google DeepMind的资深AI科学家。

    - X1 O8 k; u3 y- H2 ]& a% V

    2024年7月3日——成立仅八个月后——Kyutai发布了Moshi


    ' d$ j& H# D2 i1 p

    Moshi是全球第一款真正的实时、全双工语音对话基础模型。它的响应延迟——160毫秒——比人类对话的平均间隔还短。 与GPT-4o的高级语音模式和ElevenLabs的语音AI不同,Moshi不是"语音识别→文本处理→文本转语音"的流水线架构。它是一个单一的、端到端的语音模型——直接从语音到语音,没有中间文本表示的瓶颈。

    : a( @4 J; l) O- S& [

    它的意义不在于它"更好"。它的意义在于:一个不到30人的团队,在一个非盈利的开放科学框架下,用不到一年的时间,在语音AI这个前沿赛道上做出了全球领先的创新。而且他们将模型权重、训练代码、训练数据全部开源。

    ' ~$ t' N  e; \5 w" o* E

    这本身就是对"只有硅谷盈利巨头才能站上AI前沿"那套叙事的回应。

    1 H( d7 @: i6 W

    Xavier Niel的30亿欧元赌注3 S' V- L4 _/ k! w3 r6 V. d

    但Moshi改变不了Kyutai——以及整个法国AI生态——面临的根本问题。


    $ l- X- _- |/ }( i  \; d5 c

    Xavier Niel承诺通过Iliad集团向法国AI投入30亿欧元。这笔数字听起来像是一个大型投资——但在AI基础设施的世界里,它的实际购买力令人不安。微软2025财年的AI资本支出预算约为800亿美元。按年度折算,Niel的30亿欧元(三年期)约等于微软两三周的AI基建支出。

    3 l! B+ l, Q' h0 k  o# P, u( h

    这已经不是数字大小的比较,而是级别的差异。一个法国电信亿万富翁做出他毕生最大的AI投资——在硅谷,它只是微软季度财报的一个脚注。

    8 ~0 J- U' y0 G

    Moshi的训练使用了Scaleway(Iliad集团的云服务商)的H100 GPU集群。但Kyutai自己承认——如果要训练下一代更大规模的模型,他们需要算力规模比现在至少大一个数量级。而这种规模的算力,目前在欧洲只有通过EuroHPC的公共超级计算机——或者通过AWS/Azure/GCP的商业云——才能获得。

    4 e% G! a1 ]+ G

    欧洲AI创新发生在欧洲。但为大模型提供算力的发电机,在美国。


    * ]* [# p! I9 f5 T

    Mistral:冠军的重量
    ( S. R9 @4 |8 P* Q1 q/ L+ c+ v

    与Kyutai的"开放科学"叙事并行的,是Mistral的"商业冠军"叙事。

    - K  e0 h: f( b3 }

    Arthur Mensch的故事本身就是一篇欧洲AI的寓言。ENS毕业。Inria博士。DeepMind研究员——在伦敦参与了Chinchilla和Retro等高效大语言模型的研究。2023年初回国。联合两位前Meta AI Paris的研究员。4月28日注册公司。6月——成立仅两个月——种子轮融资1.05亿欧元,欧洲历史最大种子轮。

    * ^6 ^, n# `# M; ?6 N" j

    9月发布Mistral 7B——一个以Apache 2.0许可发布的开源权重模型,在多项基准上碾压同等规模的Meta和Google模型。12月——距成立仅八个月——估值突破20亿美元。同月发布Mixtral 8x7B——一个混合专家模型,在性能上击败了Llama 2 70B但推理速度快六倍。

    法国总统马克龙亲自在公开场合为Mistral背过书。"法国和欧洲必须成为AI领域的主权行为者。我们不能依赖外国力量来获取那些将定义我们的经济、我们的民主、以及我们公民日常生活的技术。"他在2023年的VivaTech峰会上这样说——就在Mistral刚刚完成种子轮的第一个月。这是一位国家元首,在为一个当时不到两个月的初创公司公开站台。

    2 u/ M- s& P+ ?& X% C. ?2 o9 c

    这是一个几乎完美的叙事——直到2024年2月的微软投资争议将它撕裂。


    4 J' n) {! b) c  {* p

    1500万欧元的政治地震9 h3 t& r: f; {/ R

    微软的1500万欧元投资在纯金融意义上微乎其微。它在Mistral估值中的占比不到1%。在微软的资产负债表上根本不会出现在前20行。但它在政治意义上的冲击力是毁灭性的。


    5 M( ]  O  F. [. X4 c+ x

    因为在2023年11月到12月期间——就在这笔投资披露的两个月前——Mistral的创始人和法国政府官员正在布鲁塞尔密集游说欧盟立法者,要求弱化EU AI Act草案中对"基础模型"的监管条款。他们的核心论点是:"如果你们用过度监管束缚欧洲AI公司,你们就是在用法律帮助美国公司独占市场。"

    这个论点赢得了同情。欧洲议会中的多个党团——尤其是法国的代表团——为"保护欧洲冠军"削弱了法案中的多项合规要求。一位密切参与谈判的议会助理事后用一个比喻形容:"我们降低了城堡的城墙,因为Mistral告诉我们他们是欧洲的骑士。然后我们发现骑士在城墙上开了一扇门,给了微软钥匙。"


    + I7 N$ w* _% ]* ~& u& B( @6 @

    法国科技媒体《Les Echos》的标题是:"Mistral,一个被微软咬住的欧洲AI冠军。"德国《Handelsblatt》:"巴黎的AI梦在微软的怀抱中醒来。"


    " c& ^$ R/ X5 B. d7 l2 P6 j, t

    争议之所以如此剧烈,不是因为事实本身——一个AI公司与云服务商合作是完全合理的商业行为。真正刺痛欧洲的是另一层:欧洲AI公司在口头上必须承诺"主权",但在实际运营中必须依赖"非主权"的基础设施。 这不只是虚伪问题,而是结构性困境:如果你只有两个选择,要么用Azure的GPU训练模型、让一家欧洲公司还能在全球AI市场竞争,要么坚持纯欧洲算力但模型落后两代——你选什么?


    * H& N# n: X! v) H

    Mensch在那句话上说出了真相:"如果欧洲想要主权AI,它必须先建设主权算力。"但这句话本身也是一个赤裸裸的承认:目前欧洲还没有主权算力。

    开源权重≠开源8 Z# C5 ~2 a" x' X' [

    Mistral的另一个持久争议在于"开源"这个词的使用。

    ' i% y& j" }/ @5 f% |, }+ B

    Mistral 7B和Mixtral 8x7B以Apache 2.0许可证发布了模型权重——任何人都可以下载、修改、部署。这是"开源权重"(open-weight)。但它不是完全意义上的"开源"——训练数据不公开,训练过程不公开,技术报告没有GPU小时数、没有数据构成、没有训练曲线。


    - b. Q3 K+ P  B* O6 ~  j, ~4 l

    真正的开源AI——比如Kyutai的Moshi、或者后来DeepSeek的R1——发布的是模型权重+训练代码+技术论文的完整三元组。Mistral发布的是模型权重加一份选择性披露的博客文章。


    . m1 s* {! `; x

    "开源权重但不是开源"这个灰色地带在2023年到2024年间迅速成为全球AI政策中最激烈的定义之争。EU AI Act最终为"开源"AI模型提供了合规豁免——但它们需要满足的前提条件正是:必须公开训练数据的摘要。 Mistral的早期模型——没有公开训练数据——无法获得这个豁免。


    $ I7 |" j; k* ?

    这不仅仅是Mistral的问题。它暴露了一个困扰整个欧洲AI主权叙事的问题:如果连"什么是开源"都无法达成一致,那"主权AI"——一个比"开源"模糊十倍的词——到底意味着什么?



    ' l! a. s' d0 Y* }! A% ~& W+ Y1 L4 e

    " l2 K2 X# E* }. P- G" t: A; z第四章:西班牙——100%公共AI的纯粹实验
    * }9 i+ q# C3 V/ \9 a

    如果法国代表的是"欧洲AI的资本焦虑",西班牙代表的是"欧洲AI的公共理想"。


    # f, k6 l: ^+ [1 A* d* M

    ALIA:用纳税人的钱,为纳税人建AI
    & A$ l4 y9 ?8 u& m4 V0 H4 \

    ALIA是巴塞罗那超级计算中心(BSC-CNS)领导的西班牙国家AI大模型计划。它的资金来源只有一个通道:公共预算。 没有私募。没有风险投资。没有微软的合作协议。

    * @, u" c3 _7 s" A! B

    这是欧盟第一个完全由公共资金资助、完全由公共机构执行的国家级AI项目。它的旗舰模型系列叫MarIA——西班牙语、加泰罗尼亚语、巴斯克语、加利西亚语的专属多语种大语言模型。


    ( f% k+ @8 w" }. h7 m, T: _

    MarIA不是要和GPT-4抢市场。MarIA的目标是更基础的一个:确保西班牙的公共行政——政府机构、法院系统、公立学校、公立医院——可以部署AI服务,而无需将公民数据交给一家注册在加利福尼亚州的美国公司的API。

    这是一种非常欧洲的主权理解:重点不是"我的AI比你的AI更强大",而是"我的公共机构使用的AI不依赖你的基础设施"。

    ( P$ m+ t# F% L) }7 S

    , Z5 F0 \; c/ ~) M6 a0 nMareNostrum 5:公共算力的要塞
    ( R; P* j2 x3 g8 g0 D. E+ i9 ^

    驱动ALIA的发动机是MareNostrum 5——一座位于巴塞罗那郊外的HPE Cray EX超级计算机。持续算力215千万亿次(PFLOPS),峰值314千万亿次。在2025年TOP500全球超级计算机排名中位列第14位。


    * r5 v' m0 E$ A* l' G

    它的GPU部分——专用于AI训练——使用的是NVIDIA H100 GPU。它的CPU部分使用的是Intel Sapphire Rapids处理器。严格来说,MareNostrum 5的芯片仍然依赖美国供应链——但它的所有权、运营权、物理位置、法律管辖权全部在西班牙境内。对于ALIA项目来说,这个区别足以构成一道"主权墙":在MareNostrum 5上训练的模型,其训练数据、模型权重、推理日志全部在西班牙法律管辖的服务器上——不受美国《云法案》(CLOUD Act)的管辖。


    8 H8 c- a6 Z+ ]( w6 L5 C

    BSC的AI主管Josep Maria Martorell将ALIA描述为"一种新型的公共基础设施——类似高速公路或电网,但处理的是智能而不是电力。"

    3 L" i& m2 U4 F; j: }, ]3 z$ C' P

    这个想法看似平凡,认知上却很激进。它将AI从"产品"重新分类为"公共品"——一种由国家建设、由纳税人出资、供全体公民使用的共同资源。这几乎是与硅谷的"AI as a product"和中国的"AI as a national security asset"完全不同的第三种认知框架。


    8 i: W- F: Z- ~0 J


    1 {0 U7 |/ b( Z( O6 i3 o

    8 N4 i# n/ H. T7 c第五章:德国——可解释性的护城河  C" @; {7 t3 G& B

    如果法国的主权AI故事围绕"资本焦虑",西班牙围绕"公共理想",德国围绕的就是一个特定的德文概念:Erklärbarkeit——可解释性。

    ) V) B4 e, [3 n3 [" q% z

    Aleph Alpha与"德国的AI"
    / I  i# k* w7 o$ {$ K

    Aleph Alpha由Jonas Andrulis——一位前苹果AI工程师——于2019年在海德堡创立。这个名字本身就是一种宣言。Aleph是希伯来字母表的第一个字母。Alpha是第一个。它是"开端"——两个开端。这是一种暗示:不是替代OpenAI,是开启一个与OpenAI在哲学上不同的路径。

    " ?, n: b5 W5 y; E+ C7 }

    Andrulis的核心论点是:AI模型不仅应该"正确"——它应该能被解释。你应该能问一个AI:"你为什么得出了这个结论?"——而且它应该能给你一个可追溯、可审计的答案。不是事后猜测。不是外包给另一个AI。是内建的可解释性


    * `! U0 q4 L- W

    在2022年到2024年间,Aleph Alpha从Bosch(博世)、SAP、Schwarz Group(欧洲最大零售商)等德国产业巨头那里陆续筹集了超过5亿美元的融资。它的核心客户不是消费者——是德国的中型工业企业(Mittelstand)、是州政府。巴登-符腾堡州——德国制造业的心脏——部署了Aleph Alpha的AI,为8万名政府雇员提供内部信息服务。

    ' v2 @8 [5 w: S' T3 w1 V

    这些客户选择Aleph Alpha而不是OpenAI或Google的原因不是"它更聪明"。原因是:它可以被审计。 一个使用OpenAI API的德国政府部门,无法向议会解释——"为什么一个美国公司的大语言模型拒绝了一个公民的福利申请?"——因为OpenAI不会给你权重、不会给你训练日志、不会给你激活图。Aleph Alpha——至少在它的价值主张里——可以。


    0 l9 i* v- R' Y: |6 ?" @! F

    Luminous:一个被市场比下去的技术6 T! ^8 j' \+ b5 f& ]3 O2 |

    Aleph Alpha在2023年发布了一个名为Luminous的模型系列(130亿、300亿、700亿参数),其可解释性功能——包括AtMan(注意力操控,一种能够可视化哪些输入导致了哪些输出的技术)——在技术层面是独特且有学术价值的。但在2024年,当Mistral和Meta的开源模型以更高的性能-成本比涌入市场时,Luminous在原始性能维度上被远远甩在了后面。

    . v% z& ?% a8 l" X( m" ]

    Aleph Alpha被迫在2024年进行了战略转型——从"训练自己的通用模型"转向"开发AI安全和合规平台"。它推出了PhariaOS——一个面向企业的"主权利器"平台,主打数据主权、合规管理和可解释性服务。换言之,Aleph Alpha从一个"模型公司"变成了一个"AI信任平台公司"。


    ( x0 ]- r, x  }  B3 i

    这是德国AI主权困境的浓缩版:你有技术深度、有客户信任、有"可解释性"这个独特的卖点——但当你面对一个在纯性能上碾压你的通用模型时,你无法靠"可解释性"赢得市场。 你可以靠"合规"和"信任"赢得政府合同的护城河——但那道护城河的内侧是一个限制增长上限的围墙。

    : Q$ Z! l* R+ E* j+ [2 M; o( s8 @

    Helsing:防务AI——另一种主权定义' M  B, w! d# _

    就在Aleph Alpha苦苦转型的同时,柏林还有另一家AI公司正在以完全不同的方式定义"德国AI主权":Helsing

    4 @+ T& P+ o& J8 ]5 p' D; |

    Helsing成立于2021年,由三位联合创始人——Torsten Reil(前NaturalMotion游戏AI公司CEO)、Gundbert Scherf(前麦肯锡防务顾问)和Niklas Köhler——在慕尼黑创立。它不建通用语言模型。它不追求"可解释性"的商业合规市场。它做的是防务AI——战场感知、威胁识别、多域态势融合。

    1 P" F8 }3 ^4 f

    2023年到2024年间,Helsing从General Catalyst、Saab、Prima Materia等投资方筹集了超过8亿欧元融资,估值一度达到50亿欧元级别。2024年,Helsing获得了为Eurofighter台风战斗机提供AI战场感知系统的合同——这是欧洲防务AI从概念走向实战部署的标志性事件。德国国防部将Helsing列为"关键技术合作伙伴"。


    5 D; D% ?7 l; s9 }

    Helsing的存在本身是对Aleph Alpha的"可解释性主权"路径的一种补充——甚至是一种驳斥。Aleph Alpha用一个"透明"和"可审计"的AI来获得政府的信任。Helsing用一个在国防机密框架内运行、不可对外解释、但能在真实战场环境中决定生死的AI来获得政府的信任。这是两种完全不同的"主权信任":一种是理性信任("我知道它是怎么得出这个结论的"),另一种是性能信任("我不需要知道——我只需要它在战区内不出错")。


    1 X& ]8 m3 I: u$ t. [4 G7 n# g" q

    德国同时拥有Aleph Alpha和Helsing这两家AI公司,意味着它在"主权AI"这个模糊概念上同时押注了两条路径:用透明性赢得商业和政务市场,用实用性赢得国防市场。 这也许是欧洲主权AI最务实的双轨策略——而它恰好发生在欧洲最大的经济体中。


    ( l  x5 E) f* w& _


    ; J5 M( C- l  L+ L% E

    * P# F( ?7 e; D/ X" R4 G$ @# }) I第六章:欧洲算力——大教堂与空地基
    0 d& S; q% w! e: w& U/ r

    在结束国家层面的巡礼之后,需要站在欧洲整体的视角来看最后一个——也是最根本的——问题:欧洲到底有多少AI算力?

    EuroHPC:欧洲的公共算力联盟, g/ a9 j, |1 m+ b

    EuroHPC JU(欧洲高性能计算联合事业)是欧盟试图协调成员国超级计算资源的一种独特制度安排。在2018年至2027年期间,EuroHPC已投入约100亿欧元(欧盟委员会+成员国联合出资),建设了12台超级计算机——从芬兰的LUMI(TOP500第9位)到意大利的Leonardo(第10位)到西班牙的MareNostrum 5(第14位)到即将上线的JUPITER(德国,目标第4位,1 EFLOPS)。


    4 F# B7 k/ h& ?. [. Y) u

    到2025年,EuroHPC已在19个地点部署了AI工厂(AI Factories)——这是将通用超级计算中心转型为专门的AI训练基础设施的一次大规模升级。到2027年前后,欧盟计划建设最多5座AI超级工厂(AI Gigafactories)——每座拥有超过10万个先进AI加速器。


    % i4 {. n+ i9 I2 P# l

    冯德莱恩在2025年2月的巴黎AI行动峰会上宣布了InvestAI计划——动员2000亿欧元AI投资(公私联合),其中200亿欧元专项用于AI超级工厂建设。


    ) u* B* x& r6 {2 \

    芯片法案:一个没有代工厂的蓝图2 ~$ [8 D2 N/ H$ O

    《芯片法案》(EU Chips Act),总动员规模约430亿欧元——欧盟历史上最大的半导体投资计划。目标是将欧洲在全球半导体制造中的份额从不到10%翻倍到2030年的20%。


    " _, Q, g: }7 f* n

    法案的三个支柱是:


    9 l6 |# Q: f) K

    • 第一支柱——"欧洲芯片倡议":支持大规模技术能力建设和研究创新(约33亿欧元欧盟预算)
    • 第二支柱——"供应安全框架":为先进晶圆厂提供补贴便利——即允许成员国向在欧盟境内建厂的芯片公司提供大规模国家援助
    • 第三支柱——"危机应对机制":在供应危机时期授权委员会进行紧急采购和出口限制
      " [3 b( B+ \) [7 J
      - n( p* T* U- e+ E: p" ]


    , A1 @! V$ O+ d/ c) E. V

    在第二支柱下,13个半导体项目已获批——包括台积电在德累斯顿的欧洲首座晶圆厂(与博世、英飞凌和恩智浦联合投资约100亿欧元)、英特尔在马格德堡的300亿欧元晶圆厂项目(已因英特尔财务困境被推迟),以及STMicroelectronics在克罗尔的欧洲最大碳化硅工厂(约75亿欧元公私联合投资)。


    3 x! |1 u( t- `( B, W

    但在AI芯片的现实政治中,EU Chips Act有一个被忽视的细节:这些工厂生产的是"成熟制程"芯片——汽车、工业、物联网用的28纳米到12纳米芯片。它们不生产任何国家用来训练前沿AI模型的4纳米到3纳米GPU。 那种芯片——H100、B200——仍然全部由台积电在台湾的工厂制造。

    ! g; d  {6 `8 U2 X+ ]

    SiPearl——一家位于法国Maisons-Laffitte的欧洲处理器初创公司——正在设计Rhea1,一款基于ARM架构的高性能计算CPU(不是GPU)。欧洲处理器倡议(EPI)——一个由27个欧洲研究机构组成的联盟——正在开发RISC-V架构的处理器路线图。但这些努力全部在CPU领域——没有一个在AI GPU领域。


    - P# ]$ A! d5 }2 [

    欧盟的芯片主权在汽车芯片、工业传感器、能源管理芯片的层面上是有意义的——但在AI芯片的层面上,它是一张空头支票。

    教堂与发电厂: Y1 c! {4 s6 O! t4 N" i

    EuroHPC的超级计算机在学术圈内备受赞扬,但它们面临一个结构性障碍:它们不是为AI公司设计的。

    , H2 F& H! ^% B8 K8 w

    一个AI研究团队需要提交一份详细的申请,等待几周到几个月的审批,获得分配的计算小时数,然后在指定的时间窗口内运行训练——如果训练在窗口内失败,需要从零重新申请。这不是一个为"我们每晚训练一个新版本,如果这个版本不行的话明天继续"的人工智能研发迭代周期设计的系统。

    ) j# P; W' p7 R' }. C1 i) s/ J% ]

    更根本的问题是规模。EuroHPC最大的AI系统——意大利的Leonardo、芬兰的LUMI——各自拥有数千块GPU。而GPT-4的下一代训练集群据估计拥有超过十万块H100等效GPU。两个数量级的差距。


    / M' f1 L( y6 i" J  T; G. l% \

    2025年初,欧盟宣布了AI工厂(AI Factories)计划——将现有的19个EuroHPC站点升级为专门的AI训练设施。2027年前后,最多5座AI超级工厂(AI Gigafactories),每座超过10万个先进AI加速器。预算是200亿欧元的InvestAI专用基金。

    : d& r6 u6 y! Z* r- E  l) G

    但有一个时间差问题:到2027年,下一代AI训练将需要的是2027年的GPU——而到了那时,前沿模型的训练成本可能已经涨到50亿甚至100亿美元级别。以2024年的算力需求规划2027年的AI工厂,就像用2018年的手机规格来设计2022年的5G标准。

    Jonas Andrulis——Aleph Alpha的创始人——曾在2023年的一次采访中用一段话凝结了欧洲AI基础设施的全部困境:"欧洲有的是大教堂——美丽、宏伟、神圣的超级计算机。但你造大教堂的时候,硅谷在建发电厂。大教堂可以供你做礼拜。发电厂可以让你生产。"

    四年过去了。教堂还在扩建。发电厂的功率在跨大西洋对岸翻倍了又翻倍。

    3 g: q) ^, m8 c


    第七章:欧盟主权AI的四维诊断算力从哪里来?
    / I, B" q7 Z+ ~5 X$ j, K

    公共超算为主,美国商业云为辅,自建数据中心正在追赶。


    # j* B0 T2 s: I

    EuroHPC提供了欧洲任何一个单独国家无法独立负担的公共算力规模。但对于需要商业速度的欧洲AI公司来说,AWS/Azure/GCP仍然是最便捷的选择。InvestAI的"超级工厂"计划如果顺利执行,到2027年以后可能改变这个格局——但在那之前,欧洲AI创新者的算力瓶颈在最关键的时刻仍然依赖跨大西洋的供应。


    ( h* @4 ~, I6 R3 n/ D

    钱从哪里来?
    2 y+ K! D, s( i- f0 D0 l+ f

    公共预算为底,私募和主权资本为辅。

    2 P+ X9 j2 `: t% z! C

    Horizon Europe(AI部分约26亿欧元)、Digital Europe(约10亿欧元)、InvestAI(2000亿欧元动员目标)、EU Chips Act(430亿欧元)——欧盟委员会层面的AI投资是系统性的、有纪律的、但不庞大的。

    9 t2 b/ m$ m$ o# U# w0 i

    Xavier Niel的30亿欧元、Mistral的估值数十亿、Aleph Alpha的5亿+美元融资——欧洲有少数敢于下重注的私人资本。但与美联储模式下流动的硅谷VC总量(美国AI初创公司2023年融资超过250亿美元)相比,欧洲的AI风险资本池子仍然浅得多。


    $ Q0 F6 `. n6 ]2 j% Z0 h

    一个值得注意的差异是:欧洲没有"国家队资本"。 沙特有PIF。阿联酋有Mubadala。中国有大基金。美国有国防部和情报界的AI合同作为事实上的"国家软资本"。欧洲有Horizon Europe——一笔按照同行评审分配的学术研究基金。


    , l; h$ Y) p4 Y1 M8 h3 R1 I% S

    技术怎么走?
    - }% X! Q: ^) d

    开源权重为主,合规为盾,可解释性为剑。


    ' C* F0 `  K; b9 R3 w3 f) f' `

    Mistral的开源权重策略、Kyutai的纯开放科学、ALIA的公共开源——欧洲AI的基础模型层基本上走了一条"开源或半开源"的路线。这条路不完全是主动选择,更像是被逼出来的市场策略。当你的算力规模无法与GPT-4或Gemini的训练集群竞争时,你可以用开源来构建一个生态系统,用生态系统的网络效应来弥补单个模型的能力差距。

    0 N: Q/ k( ]0 J4 T5 P

    但欧洲在AI技术层有一个很难被忽略的贡献:可解释性技术栈。 Aleph Alpha的注意力可视化、EU AI Act对"透明度"的法定要求——这些正在将"可解释性"从一个研究课题变成一个合规要求。而当一个技术要求被写入法律后,执行这一要求的工具本身就成了市场。


    ( n) |: \7 r* P) V

    最怕什么?0 l8 t- H; q+ ^5 _; t. m

    成为AI世界的"消费殖民地"。

    ! X1 S# Q& Y7 Z# P

    欧洲不是怕"被中国超越"——中国在欧洲AI叙事中是一个次要威胁。欧洲怕的是"被美国技术永远锁定在消费端":欧洲的科学家在硅谷训练。欧洲的企业用Azure的API。欧洲的公民数据跑在AWS上。欧洲的政治资本用来在布鲁塞尔制定漂亮的法规,但这些法规所管辖的AI——全部来自西海岸。


    / {0 [! y, e5 y3 S$ [

    所以欧盟的AI主权叙事与中国完全不同。中国的叙事是"我们要活下来"——芯片封锁下的生存危机。欧洲的叙事是"我们要有选择"——不是替代美国AI,而是保留一条自己可控的路。即使这条路的尽头不与硅谷平行,即使它的顶端只有美国AI的八成性能——只要它是独立可控的,就有主权价值。


    ( H0 H# k9 `7 q* f

    因为在这个方程里,独立性的价值不仅仅在于技术性能。它在于当华盛顿决定切断某类芯片供应、或者当硅谷决定修改某条API使用协议时——你没有接到那通电话。



    - m& n* W+ q& V% R

    , R8 K6 m% T, ^! {; q终章:第三极的生存法则) r: H0 l, d( }" \: k7 A

    欧盟在主权AI版图中的位置很特殊。它既不是迫在眉睫的生存威胁下的全栈突围者(如中国),也不是"默认值不需要解释"的规则制定者(如美国)。它处在一个尴尬但有策略空间的中间状态:知道不可能覆盖全栈,也不想放弃任何一层。

    EU AI Act试图在规则层建立护城河。 EuroHPC试图在算力层建立公共能力。 Mistral和Kyutai试图在模型层证明欧洲可以创新。 Aleph Alpha试图在应用层将"可解释性"变成一种溢价。


    9 h" `: q; p3 i4 }

    这种"每一层都做一点"的策略,代价是每一层的投入都不足以单独改变游戏规则。但它的收益在于:当任一层的依赖在危机中被切断时,欧洲在每一层都有备份选项。

    它不像中国的"全栈独立"那样野心勃勃,也不像美国的"默认值"那样舒适。它更像一个精心设计的生存策略:在你还可以控制的每一层,埋下一颗种子。不是为了马上取代谁,而是为了在那个不确定的未来里,你仍然有一棵自己能浇水的树。


    , i4 t5 q4 Z' |

    这也许是欧洲对"主权AI"最诚实的态度:不一定最强、最快、最大,但要还站着。


    下一篇预告:《东亚突围篇——算力不够时,主权从哪里来》



    ( L3 z% k; _0 L3 t2 x' X7 N, k  ^

    本文是《全球主权AI实验室巡礼》系列第二篇。下一期将转向日本(演化的AI——Sakana AI的"自然启发"路线)、韩国(技术洁癖——Naver Cloud因中国Qwen组件争议在国家代表AI项目第一轮出局)、以及台湾(语言与价值对齐——TAIDE模型如何在AI中捍卫传统中文与本土文化立场)。


    # O3 h* G1 w- p) u
    7 B: @+ L. t% z: ?' ~9 W

    点评

    油墨: 5.0 油菜: 5.0
    给力: 5.0 涨姿势: 5.0
    油墨: 5 油菜: 5 给力: 5 涨姿势: 5
      发表于 4 天前

    评分

    参与人数 1爱元 +10 收起 理由
    mezhan + 10

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2020-4-8 10:45
  • 签到天数: 227 天

    [LV.7]分神

    7#
     楼主| 发表于 4 天前 | 只看该作者
    本帖最后由 xiejin77 于 2026-6-18 08:06 编辑 3 {0 ]. B, z+ F0 f( Y

    : f! E. A3 X/ A$ c& m4 X4 e5 T东亚突围篇——算力不够时,主权从哪里来

    系列:《全球主权AI实验室巡礼——在大国博弈中寻找"破局者"》 第三篇 | 东亚突围篇


    - B. u0 a2 u$ h& e


    4 t! I- n" r* ^, A8 \
    引子:一张评审桌上的红线
    3 t% c* {$ `  W7 k& K' ~

    2026年1月。首尔。韩国科学技术信息通信部。


    + y" l4 E$ `( v$ K9 l) P

    一场决定韩国"国家代表AI"项目第一轮去留的评审会正在进行。这个项目在2025年8月选出五支精英团队,政府提供GPU、数据和研发资金支持,目标是在2027年前打造韩国自己的基础模型——一个尽可能"从零开始训练"、基于韩国数据、反映韩国语言和文化的主权AI模型。

    3 F+ ~5 \& ]8 ~7 K7 X# h0 K

    竞争者包括五支韩国AI代表队:Naver Cloud、Upstage、SK Telecom、NC AI、LG AI Research。

    ! l  ^' t# z/ g( Y! v; E- k

    没有任何一家公司比Naver Cloud更有资格留到最后。它背后是韩国的"Google"——搜索引擎、地图、电商、云服务、AI助手。它已经开发了HyperCLOVA,韩国最先进的本土大语言模型。它拥有自有数据中心。它是唯一一家在中国和美国互联网巨头入驻韩国后仍然保持独立生态的韩国科技巨头。

    " e! \! j8 E1 g( g

    但就在评审进行中,一个指控浮出了水面。

    : M6 F- S; u( [

    韩国媒体爆料:Naver Cloud提交的HyperCLOVA X SEED 32B模型被指使用了阿里Qwen 2.5-VL相关的视觉编码器和权重——这意味着它并非完全意义上的"从零训练"。

    Naver Cloud解释说,外部视觉编码器是为了兼容全球开源生态、提高多模态效率,核心语言模型仍由自身独立训练。但"从零训练"的红线已经被舆论和政治牢牢钉在了地上。

    $ D& _% p1 u& @" E/ b+ J

    Naver Cloud最终没有通过第一轮评估。它和NC AI一起出局。韩国最大的互联网公司,因为一个外部模型组件,被放置在一个无法逃脱的质疑中:你的主权AI,在多少程度上是你的?

    东亚在主权AI版图中的独特处境,就卡在这里。

    在西方,主权AI的故事是关于"如何摆脱硅谷"。

    在中国,是关于"在封锁下生存"。

    * y+ N* _; e/ [; P- F: v

    在亚洲边缘——日本、韩国、台湾——是关于一个更微妙的问题:当算力不允许你做任何"从零开始"的事、当你身边的中美两大AI帝国同时在拉扯你、当你社区的语言只有千万级母语者时——你的主权AI到底是什么?

    它不是中国式的全栈突围——没有几十万块GPU的国家很难走那条路。它也不是美国式的"默认值",更不是欧盟式的"规则护城河"。

    它更像是在约束中寻找一个别人绕不开的位置。

    / C" F+ J4 e# }



    6 W4 C3 U: ^1 J
    % R$ v9 Y' O# z8 r/ p% P7 O) [
    第一章:日本——在算力的夹缝中重新发明AI一个论文共同作者的决定
    ! a, W5 }% t( _2 A0 s1 t) n

    2017年。一篇题为《Attention Is All You Need》的论文被投向了NeurIPS会议。八位作者的名字在页首排成一行。这篇论文引入了Transformer架构——今天地球上每一个大型语言模型的底层架构都源于它。

    ( i9 w8 |* L+ r

    那八位作者中,绝大多数留在了硅谷。Ashish Vaswani和Niki Parmar创立了Adept AI。Noam Shazeer成为Character.AI的核心人物。Aidan Gomez在加拿大创立了Cohere。Jakob Uszkoreit去了德国的Inceptive。


    1 ^/ i7 c" B# S+ {, L) Q

    但有一位——Llion Jones——在2023年夏天打包了行李,飞往了东京。他要在日本创立一家名为Sakana AI的公司。

    6 s! d/ S. X. u' l

    "さかな"——日语中的"鱼"。标志是一条红色的鱼在鱼群中逆流游动。"学校的鱼从简单的规则中形成连贯的整体"——这是对公司哲学的密码翻译:用演化算法和集体智能来构建AI,而不是用更多的GPU来堆砌规模。

    # ^4 Y5 n  k. C5 s

    在硅谷,GPU数量是一种竞争手段。在Sakana,GPU数量是一种需要被绕过的障碍。


    0 h, {& H) l2 N0 h3 C

    "失去的三十年"的救赎弧线/ X1 h' o# _  r2 S. P

    Llion Jones选择东京不是一个浪漫主义的决定。它背后是日本科技界三十年的集体创伤。

    2 x8 V1 z& g/ g6 @5 k

    1988年,日本占据了全球半导体市场的约50%。NEC、东芝、日立——这些名字定义了芯片产业的黄金年代。贸易摩擦时代,《日本第一》这本书让全美国紧张。然后就是三十年的漫长滑落:半导体输给了台积电和三星(2023年日本份额不到9%)。消费电子输给了三星、LG、苹果和中国的制造商。互联网平台——完全错过。没有"日本的Google"。手机产业——被"加拉帕戈斯效应"锁在一个与全球隔绝的进化孤岛上:日本手机先进到了全世界都不认识的境地。

    6 H& a1 v- Y) w& N5 f# w/ B' P

    当Sakana AI在2023年成立时,日本已经三十年没有在一个重大的技术浪潮中站在前沿了。Sakana的成立公告中刻意连接了这一条断裂的历史线——"日本在制造业中的历史性主导地位,不是通过丰富的自然资源实现的——而是通过根本性地重新设计工厂车间。通过连续、复合的自我改进(Kaizen)哲学,日本创造了以更少资源实现更多产出的系统。"然后他们写道:"在AI中构建递归自我改进,提供了终极的Kaizen机会。"


    7 t% \3 s/ k2 p9 j& O% @* y- S

    这不像普通初创公司的营销文案,更像日本战后产业哲学在AI时代的重新编译。Kaizen——"改善"——本来是用来优化丰田产线上的每一颗螺丝的。现在它被用来优化一个AI系统自己的源代码。

    广岛:日本用"软法"参与AI治理3 P: _4 K& Y# \3 G

    理解Sakana所处的政策环境,有一个常常被忽视的关键节点:广岛。

    2023年5月,日本作为G7轮值主席国在广岛举办了G7峰会。在那次峰会上,日本发起了广岛AI进程(Hiroshima AI Process)——G7历史上第一个专门针对生成式AI的政府间框架。2023年10月,G7领导人签署了《广岛AI进程国际行为准则》——一份11条的AI开发者自愿行为规范,涵盖风险识别、透明度、问责制和安全管理。


    - Z: c$ e2 i- B0 w/ C

    但最关键的不是准则的内容。是日本选择了**"软法"路径。与欧盟的AI法案——一部有罚款、有禁令、有合规审查的法律——完全不同,日本的广岛进程是一套自愿的、迭代的、由行业主导的自律框架。日本经济产业省的官员们在解释这一选择时使用了一个日语行政术语——"行政治导"(gyosei shido)**——一种非强制性的、通过共识和协商达成合规的监管哲学。

    - b) y' H" T" g9 a

    这并不等于"日本在AI治理上落后"。更像一个刻意的战略选择:如果日本没有资源在算力层与中美竞争,它可以在"什么是负责任的AI行为"这个规则层,占据一个与中国不同、又不像欧盟那样沉重的位置。 广岛AI进程是日本试图在这个维度上成为一个规则参与者——不是规则制定者(那是欧盟),也不是规则抵制者(那可能是某些发展中国家的默认路径),而是一个规则促进者


    6 n  m$ w3 \& q6 |1 h

    这也解释了为什么Sakana能在日本获得这么多政策支持。METI的GENIAC计划为Sakana和Preferred Networks等本土AI公司提供了数亿美元的计算资源和研发补贴。Rapidus——日本在北海道建设的2纳米芯片工厂,政府已注资超过2500亿日元(约17亿美元)、32家日本企业联合参与——是日本半导体复兴的旗舰项目。Kishida政府的AI战略委员会(2023年5月成立)将AI定位为"经济安全保障"(keizai anzen hosho)的核心——这个词本身就说明了一切:在日本的政策语言中,AI首先是安全问题,其次才是产业问题。

    对抗引力
    # _9 Z8 R7 O2 d2 F

    理解Sakana AI需要先理解它所处的环境。日本作为AI训练算力的拥有者,在全球范围内几乎是隐形的。估算:日本拥有不到全球高端AI GPU总量的2%。美国约55%。中国约25%。

    - p' ]$ E  T& P3 S3 q, D3 D

    这意味着:任何一个Sakana AI的竞争对手——OpenAI、Google、Anthropic——拥有的GPU数量比整个日本都多。


    : m0 e3 m4 Q( H

    但Sakana的创始人们看到了一个不同的角度。他们在一次内部备忘录中写道:"在日本的约束下构建AI,提供了终极的设计限制。我们被驱使去追求的是优雅、适应性和自主性——而不是依赖暴力规模。"


      p9 _3 h$ ~2 U$ L" e6 h

    David Ha——Sakana的CEO,前Google Brain研究员——把这句话翻译成了更可操作的版本:"智能生命不是从富足中诞生的。它是从稀缺中诞生的。"


    + z6 m2 m# B& K8 h7 ^7 Q( T

    演化胜过训练$ z  x  t! V3 ?

    Sakana AI的旗舰技术叫做进化模型融合(Evolutionary Model Merging)


    " U6 J6 ^/ J& r

    传统方法:用一万块H100从头训练一个模型——花费数千万美元。反向传播、梯度下降、分布式训练、等等。

    4 w( h5 u+ O6 C$ c

    Sakana的方法:用演化算法自动搜索——在数百个已有的开源模型中找出最佳的组合方式,然后将它们"融合"成一个具有新能力的模型。两种融合路径:数据流空间融合(在不同层之间混合权重)和参数空间融合(进化搜索最优的权重混合策略)。两者都不需要反向传播。两者都不需要GPU集群。你可以在没有任何额外训练算力的情况下完成——一台普通的Linux工作站就够了。


    " }' F! Z! [+ T; w8 Z& g

    2025年1月,这篇论文发表在《自然·机器智能》上。一个7B参数的日语模型——EvoLLM-JP——通过融合六个不同的小型日语模型创建,在日语基准上击败了某些70B参数的模型。突破点不在"更大",而在"更聪明"。7B的参数总量,打败了10倍于它的竞争对手。

    但EvoLLM-JP只是一个开始。


    ' i2 s  B3 D0 B' {0 m' `

    2024年8月,Sakana发布了AI Scientist——一个能够自主设计实验、编写代码、分析数据、撰写论文并提交至同行评审的AI研究系统。2025年3月,AI Scientist生成的一篇论文通过了ICLR Workshop的同行评审。2026年3月,另一篇论文被《自然》接收发表。

    这是AI史上的第一次:一个由AI自主完成的科学研究,从假设生成到实验设计到论文撰写,通过了人类最高级别科学期刊的同行评审。


    5 j4 I5 c* [% k1 I7 @3 ?: \8 [5 Z

    2025年5月,Darwin-Gödel Machine(DGM)发布。这个系统不只是"生成代码"——它改写自己的源代码。它将Kurt Gödel的自指数学逻辑与Charles Darwin的自然选择结合在一起。系统在迭代中持续自我改进:一代代码的漏洞被下一代自动修复。一个令人起鸡皮疙瘩的数据点:DGM的SWE-Bench性能在两代内从约20%翻倍到超过50%。一个AI系统,在没有任何人类干预的情况下,通过自己的演化压力,把自己的编码能力提高了2.5倍。

    4 q" C% h) D0 I

    2025年6月,ALE-Agent参加AtCoder启发式编程竞赛——一个面向人类程序员的高难度优化编程比赛。它在804名人类参赛者中排名第一。第一个在竞技性编程比赛中击败所有人类选手的AI代理。

    ' `4 j$ h+ k( ]( D

    这些突破有一个共同特征:它们都不需要前沿大模型的算力规模。 Sakana不是在"用更少的GPU做同样的事"——它是在"用完全不同的方法,创造出连海量GPU都做不出来的东西"。

    ( M7 J* ~  N4 b# `$ t4 q3 `

    Kaizen编码  Z  r& U3 ?" R

    Sakana最聪明的一招——也许比任何单一技术都更聪明——是它将自身战略与日本的工业哲学重新连接了起来。


    ' f$ T  Y9 x- t! I5 }1 k, W

    "日本在制造业中的历史性主导地位,不是通过丰富的自然资源实现的——而是通过根本性地重新设计工厂车间。通过连续、复合的自我改进(Kaizen)哲学,日本创造了以更少资源实现更多产出的系统。"


    ( h5 p: n" h) L1 S1 k( I

    Sakana的创始人将这句话放在了它们的"递归自我改进实验室"(RSI Lab)的成立公告中。他们继续写道:"在AI中构建RSI,提供了终极的Kaizen机会——一个能够使自己的每一代都变得更智能的系统。"


    " B+ R% c0 [5 ~6 L+ i

    Kaizen编码这个隐喻是一种叙事上的精密武器。它将对日本技术衰退的叙事——"日本失去了半导体,失去了消费电子,失去了软件"——重新翻译成:"日本从来没有失去它最深层的能力——用更少的资源做出同样优秀的东西。AI只是这种能力的一个新的出口。"

    1 e# K& p6 e6 b; t, o( Q

    3 p# o# i7 E: Z  \国家的拥抱

    ! I6 p8 ]4 a7 d/ x- S

    日本政府——尤其是经济产业省(METI)——没有错过这个机会。


    " S% I  I! Z* c; G# ~: K: v" T- C& f3 A

    GENIAC计划为Sakana AI和Preferred Networks等国内AI公司提供了数亿美元的计算资源和研发补贴。日本在2022-2024年间与IBM合作成立了Rapidus——一家旨在到2027年生产2纳米芯片的合资晶圆厂,政府拨款超过2500亿日元(约17亿美元),32家日本企业联合参与。文部科学省在Fugaku的继任者超级计算机上投入了数百亿日元。筑波的AI桥接云基础设施(ABCI)从1.0时代的V100逐步进化到3.0时代的6128块H200 GPU——6.2 EFLOPS的AI算力。

    5 g4 S6 W6 s1 a$ k2 G1 [

    但日本算力支持最醒目的象征可能是Vinod Khosla——OpenAI最早的机构投资者——投向Sakana的那张支票。


    , z. \/ n2 C8 }2 H/ ?  p- S

    Khosla在2024年1月Sakana种子轮时的说明书中写下了这段话:"大多数主权国家都会想要自己的本土基础模型——无论是出于国家安全的原因,还是为了更好地与区域方言、文化和价值观互动。我们在印度支持了这种努力,现在我们也在日本支持它。"

    ! R  O7 u  f: y* W; |. R4 l9 _6 L

    这是一个硅谷传奇VC——一个通过投资OpenAI和Anthropic赚了数百亿美元的人——在说:"是的,主权AI是未来。"而他此刻的押注不在硅谷,在东京。

    " j7 W0 L) K  ~! T; V

    Lux Capital的Josh Wolfe说得更直接:"在一个日益复杂的世界中,亚洲需要、也将拥有一位有影响力的新AI开拓者。日本——一个强大的民主国家和美国的重要盟友——正处在这个位置。"


    ' _# D" d5 v; D* ?

    Wolfe的这句话包含了一个未被完全展开的地缘政治编码:"民主国家"和"美国盟友"。在日本被定位为"亚洲AI开拓者"的话语中,隐含着一个与中国的AI生态形成"民主AI联盟"的战略意图。Sakana不是一家纯粹的技术公司。它在华盛顿和东京的外交谈话中占据着一个特定的位置——亚洲AI民主替代方案的技术孵化器。

    主权AI最利的一刀:Namazu  H  Z+ [; m* _* c' N( Z7 ?/ v

    在所有Sakana的产品中,Namazu是与主权AI概念最直接相关的——而且也是最政治化的。

    - }9 I' Z2 h. g5 U; R

    Namazu是一套后训练技术,用于将前沿开源模型(包括DeepSeek、Llama等)适配为日本语境下的可用模型。但Namazu做的不只是"语言翻译"——它在做审查移除

    - m9 |- G* |' d) r: B' b

    在Sakana的测试中,DeepSeek-R1——中国的开源推理模型——对Sakana测试集中72%的"政治敏感"查询选择了拒绝回答。Namazu在后训练阶段重新训练了模型的回应行为——将拒绝率从72%降到了接近零。同时Namazu保持了模型在数学、编码和推理任务上的前沿性能。


    ; B% o0 N1 c, Q) h2 T$ R. W

    这是一个在主权AI维度上具有爆破力的操作。它意味着:中国的主权AI——用自己的数据和价值观训练的、符合中国监管要求的模型——可以被另一个主权国家通过算法层面的"去审查"操作重新变成可以自由讨论敏感话题的工具。

    Sakana的立场是中性的——"我们只是把模型适配给日本用户,让他们可以讨论任何话题。"但在今天,这种"中性"本身就带着政治意味。当一个国家用训练数据来决定"什么可以在AI中被讨论"时,另一个国家的公司正在开发"解封"这些限制的工具。


    $ J, s5 U# d% R3 L5 [: R$ J

    这也许就是"主权AI"最深层的矛盾:你可以在模型权重中刻入你的价值观——但你无法阻止别人在权重上重新训练出一套相反的价值观。


    第二章:韩国——技术洁癖的悖论半导体巨人,AI侏儒
    / |" W* r/ ]) ^4 m/ Q

    韩国在逻辑上应该是AI超级大国。


    & l7 c5 J4 {2 V

    • 三星:全球最大的存储芯片制造商。
    • SK海力士:全球第二大存储芯片制造商,NVIDIA H100/H200/B200 GPU所需的高带宽存储器(HBM3/HBM3e)的主要独家供应商。
    • HBM市场份额:SK海力士约50%,三星约40%。没有韩国的HBM,全球AI训练就会停摆。
    • 研发强度:韩国研发支出占GDP的4.9%——全球最高。
    • 互联网速度:全球最快。智能手机普及率超过95%。! v$ ^7 g8 k( @
      8 U* }8 r6 |1 H

    - c/ P* A! r/ l& M7 m

    但韩国的AI成绩单与这份简历形成了刺眼的对比:在2025年全球前沿AI模型的前十名中,没有一家韩国公司。

    Naver的HyperCLOVA X——韩国最先进的本土模型——在性能上与GPT-4存在显著差距。韩国没有Llama级别的开源模型获得全球采用。韩国的AI研究引用量排在中国、美国、英国、加拿大之后。一位韩国AI产业内部人士用一句话概括了这种集体心理:"我们制造了全世界AI需要的记忆体——但我们的AI记不住任何我们想让它记住的东西。"

    - I8 Q0 }$ Y7 L5 s  ~" n+ {6 p

    从零训练的代价6 l# }. I% `: g* h& K6 ?

    2025年启动、2026年进入第一轮淘汰的韩国国家代表AI项目,将"独立开发"和"从零训练"推到了近乎身份审查的位置。

    这是一个激进的选择。因为"从零训练"在工程上没有必然优势。一个用DeepSeek、Qwen或Llama作为起点进行大规模领域适配和再训练的模型,其性能可能远优于一个从零训练的较小模型。从零训练一个70B参数级别的模型——即使在有数千块H100可用的情况下——也需要数千万到上亿美元的投入、一支世界级的分布式训练工程团队、以及至少几个月的时间。


    / v+ i6 x# I$ S7 H

    但"从零训练"的符号意义远远超过了工程意义。在2026年的国际政治语境下:

    • "基于美国开源模型(如Llama)微调"意味着"在技术层面接受了硅谷的起点"。
    • "基于中国开源模型(如Qwen、DeepSeek、Yi)微调"意味着"在技术层面接受了北京的起点"。
    • "从零训练"意味着"你的主权AI是真正由你自己生下来的,不是被别人的模型养大的。"
        h! [/ q/ o/ q6 t* y% S, U; V  C
      ( g6 o6 {1 X6 ^7 s# @: {

    & Z# R, \4 A- B( W8 F9 M

    参与竞争的除了Naver Cloud,还有Upstage、SK Telecom、NC AI和LG AI Research。Upstage代表创业公司路线,SK Telecom代表电信与产业资本,NC AI来自游戏与内容生态,LG AI Research则由首席AI科学家Honglak Lee领导,专攻化学、材料和生物技术领域AI。


    . {/ Z) _4 ~" l1 p. B. r

    但Naver是唯一一家在韩国AI竞赛中有自主大模型实战经验的公司。它的HyperCLOVA X——在国内基准测试(K-MMLU)上得分55.21——已经展示了韩国AI的最高水平。

    " _6 @7 Z/ u1 e; j9 b, M

    所以当"Naver使用了中国模型组件"的指控浮出水面时,震动是双重的:技术上的震动——"韩国最好的AI,还是离不开中国开源生态"——和情感上的震动——"即使是我们自己的科技冠军,也无法真正做到独立。"


    ( p( M3 S0 p2 X

    Naver Cloud解释说外部视觉编码器是为了全球生态兼容和效率优化,核心模型仍由自身独立训练。但在政府评审语境里,这种解释没有越过"独立性"门槛。在开源AI已成为全球潮流的2026年,韩国的主权AI模型选择了更高的纯度要求。这可能是因为——正如某些韩国AI内部人士匿名指出的——"真正从零训练一个世界级的模型,对于任何一家韩国公司来说,在成本和技术上都是极其困难的。但公开承认这一点,在政治上是不可能的。"


    ( ~  U- u5 L* V! V

    "去中国化"作为一种默认设置
      o0 G6 R4 q$ \5 z' g

    韩国AI生态中有一个未言明的焦虑:"去中国化"正在成为一种默认的隐含标准。

    不是因为任何一条法律明确要求了它。而是因为在韩国的公共舆论和政治气候中,任何一项"使用了中国技术"的指控都带有摧毁性的声誉风险。当你的国家在半岛上与朝鲜对峙、而中国是朝鲜最重要的经济支持者——"使用中国AI模型"听起来像是一种安全妥协。

    1 B: `# {8 q) Z5 [$ o, W

    但这种"默认的去中国化"有一个成本。中国拥有全球最大的开源AI生态之一。DeepSeek-R1的MIT许可模式允许任何人免费使用和修改——包括韩国公司。在纯粹的技术效率层面上,基于DeepSeek微调一个韩语专精模型可能是最省时、最省钱、性能最佳的选择。问题在于,这件事不能只按技术效率来算,它首先会被放进政治语境里判断。

    - g% h3 P2 K) U- i$ C% R" Z# a4 v

    这就引出了韩国主权AI的终极悖论:韩国追求"从零训练"的技术独立,但它用来从零训练的GPU——全部由NVIDIA设计和台积电垄断制造——都与"从零"差了十万八千里。 韩国要求一个模型从"绝对零度"出发——但在物理层面上,它跑的所有运算都在一个美国芯片和一个台湾代工厂构建的硬件上。

    7 O" y: W! V, I" H8 w0 p

    "从零训练"是一句在模型层最窄处喊出的军令。在芯片层、系统层和框架层——在那里,"从零"根本不是一个可选项。

    + j  `3 T4 _, A& K

    韩国的"第三极"博弈:芯片初创与AI G3
    % S. c' H* N7 n

    韩国的AI野心不止于大模型。"AI G3"——尹锡悦政府在2023年宣布的目标——是要让韩国成为继美国和中国之后的全球第三大AI强国。这个目标听起来野心勃勃,但其背后是韩国的半导体积累。


    % m* g. r! N8 u( G

    韩国正在孵化自己的AI芯片生态系统。Rebellions——一家韩国AI芯片设计公司,其ATOM芯片在数据中心推理任务中展示了与NVIDIA竞争的性能效率——已从KT、SK电信、淡马锡等投资方筹集了超过2亿美元。FuriosaAI——设计了Warboy AI推理芯片——已获得Naver和DS Asset的投资。Sapeon——SK电信的AI芯片子公司——同样在推理领域布局。三家加起来,韩国AI芯片初创的融资总额已超过5亿美元。

    8 u8 A  h, e' Y% F6 K* q

    但这些芯片全部用于推理,而非训练。训练芯片——仍然是NVIDIA的H100和B200。韩国没有一家公司正在设计能与H100竞争的AI训练级GPU。这意味着:即使韩国造出了全世界最高效的AI推理芯片,它用来训练HyperCLOVA X下一代模型的GPU——仍然是从NVIDIA购买的。

    这是"AI G3"目标最令人不安的断层线。韩国可以控制HBM存储器的全球供应。它可以设计世界级的AI推理芯片。它拥有最高的R&D投入比。但这些优势的叠加——到目前为止——仍然无法弥合一个根本性的缺口:在训练前沿AI模型所需的算力规模上,韩国没有替代NVIDIA的路径。

    而Naver的HyperCLOVA X——韩国自主AI的最高代表——在K-MMLU(韩语大规模多任务语言理解)基准上得分55.21。这个分数在韩国国内模型中是最高的——但与GPT-4的86.4、Claude 3 Sonnet的79.0、甚至中国Qwen 2.5-72B的86.1相比,差距是两位数百分点的。在KorNAT(韩语自然语言理解)基准的常识知识推理(CKA)维度上,HyperCLOVA X得分70.7,超过了竞争对手38.6的平均分——这证明了韩语母语训练的价值。但在全球基准上,这份差距的存在本身就是一个持续的政治焦虑源头。


    5 ]5 O8 U* C! ^, T* ^. G# g

    记忆体悖论
    2 p1 _$ W6 q! s& P

    韩国的AI困境在SK海力士和三星的HBM工厂里被物理化地放大了。

    ( v" a/ m, W6 I1 l' g! F, h- H

    SK海力士的利川工厂生产着NVIDIA H100 GPU中的HBM3e存储器。这些存储器被封装进台积电代工的GPU芯片中。GPU被运往OpenAI、Google、xAI的数据中心。这些数据中心用配备韩国存储器的GPU训练出GPT-5、Gemini和Grok。然后这些模型被部署到全世界——包括韩国——通过API向韩国公司收费。

    1 I2 T4 X' [; s4 ]& l/ }

    在全球AI价值链中,韩国占据着一个绝对不能没有它、但同时又没有任何定价权的位置。SK海力士为HBM定价——不是基于"我们的技术值多少钱",而是基于"NVIDIA愿意出多少钱"。三星在晶圆代工上被台积电压制。韩国半导体强权是真实的——但它是一种**"强制的依赖"**:全世界都需要韩国的存储芯片,所以韩国不会被排除在全球AI供应链之外。但韩国没有控制这个供应链的任何一个决策节点。


    : R* O3 M7 u9 k/ z1 y# v7 y

    韩国"技术洁癖"的悖论也在这里。韩国用"从零训练"来表达技术独立。但它的整个AI硬件栈——从NVIDIA GPU到台积电制造到AWS云端——都在别人的控制之下。要求从零训练,是一种在模型层的最窄处用力:因为在芯片层、云层、框架层,韩国根本没有"从零"的选项。

    ! i. q3 |8 Q* Y, v$ a


    2 j* w* o/ [: Q, G9 o8 s; p
    ) e" v) ]2 Z2 h0 i
    第三章:台湾——在AI中捍卫一种字体繁体字是边界: C/ m# ?' r7 P3 z' Z5 W, X

    台湾的主权AI故事不是关于算力。台湾有全球最先进的芯片制造能力——台积电制造全球90%的先进AI芯片。但制造芯片和训练AI是完全不同的两件事。台积电的晶圆厂是用来制造晶体管的,不是用来刷矩阵乘法的。台湾的AI训练算力与日本处于同一量级——远低于中国和美国。

    2 ]( M8 I3 `3 z

    所以台湾的主权AI走的是一条语言路线。

      _; S* ?% ?) h6 w1 z

    TAIDE——Trustworthy AI Dialogue Engine——是一个由台湾国家科学及技术委员会(NSTC)牵头、联合多所大学和研究机构的跨机构计划。它的核心目标不是"做一个比ChatGPT更好的通用聊天机器人"。它的核心目标是:确保有一种AI说的是"台湾的中文"。

    "台湾的中文"这个表述本身就是一种主权宣言。台湾使用的是繁体中文(正体字)。中国大陆使用的是简体中文。这两种书写系统之间的差异不只是书法。它们代表了两个完全不同的话语体系、两套历史叙事、两种文化政治。

    $ K) m  n4 G8 x* {3 [1 u) Y

    大多数全球中文AI模型——百度的ERNIE、阿里巴巴的Qwen、智谱的GLM——是为简体中文训练和优化的。当它们被用来处理繁体中文文本时,它们会进行"繁转简"的内部转换,在简体中文的知识空间中处理查询,然后再"简转繁"输出——这是一个在字面上侵蚀语言边界的操作。


    % z& ~( B& t  k

    TAIDE试图逆转这个操作。它从繁体中文数据中训练——台湾的政府档案、本地新闻语料、学术出版物、社交媒体内容。它的训练数据反映了台湾的社会现实——民主制度、人权话语、公民社会。它不包含中国AI模型中被系统性地训练的"特定叙事禁区"——台湾的主权地位、天安门事件、西藏、新疆。


    5 f% D" R% ~/ o3 C; P& v( L

    这是一种很激进的"价值对齐":不是微调一个已有模型来过滤掉不想要的偏见,而是从数据层面就尽量避免摄入这些偏见

    - u4 U0 P4 H% \& o. `$ a! v

    沉默中的导航
    # p( |$ X% d( N! |- m$ ?  m* F

    TAIDE项目有一个格外值得注意的政治特征:它在公开政治话语中的音量极低。

    TAIDE的官方网站和学术论文中几乎不使用"主权AI"这个词。项目领导者很少在公开场合将TAIDE与中国AI模型进行直接对比。在受政府资助的学术会议上,研究人员用"本土语言模型"、"台湾语境训练"、"民主价值对齐"这类措辞——精准地避开了任何可能被解读为"台湾独立AI"的表述。

    9 B6 A9 Y' T6 W4 H0 x

    这并不是因为TAIDE没有政治意图——它显然有。真正的原因是,在一个中国大陆将其主权主张延伸到每一个政治符号的世界里,一个台湾政府机构直接宣布"我们正在建设台湾的主权AI"——这句话本身就可能构成外交事件。 北京可以立即将TAIDE定性为"台独AI"并可能启动一系列不可预测的外交和经济反击——从半导体供应链的压力到外交孤立。

    . B  N3 n3 Z4 W9 j

    所以TAIDE的项目领导层选择了一种精密的"语义平衡术":用技术语言来描述政治行动。他们总是在说"繁体中文的AI服务""本土文化保存""民主社会的AI需求"——但从不说"主权AI"本身。


    ! M! d9 w1 ~( N

    这种沉默不是怯懦。它是台湾在不对称权力结构中求生存的一种高度复杂的战略沟通。你做的事本身就是政治——但你描述它的语言必须是技术的。因为你一旦用政治语言,你的对手就会用政治反击——而你的对手的筹码比你的重得多。

    这也解释了为什么TAIDE是一个纯学术公共基金项目,而没有显眼的商业AI公司参与。学术项目有"非政治性"的外衣——尽管任何关注两岸关系的人都清楚,一个被台湾政府资助的、专门训练繁体中文和台语的AI模型,是所有"非政治"项目中政治性最强的一个。"非政治"本身就是台湾最有效的政治姿态。

    比中文更窄的语言7 o; f9 L/ z/ |

    TAIDE的目标不止于繁体中文。它正在扩展台湾的本土和乡土语言:台湾闽南语(台语)——一种在台湾有大量口语使用者但在数字文本中存量极少的汉藏语系语言。客家话——台湾第三大语言社区。16种被政府承认的南岛语系原住民族语言——包括阿美语、泰雅语、排湾语、布农语等,其中每一种的母语者都在数万到数十万之间。

    7 [& P; r( n) k, w' j% ?" s

    对于这些语言,AI不是一种"便利"——是一种生存。一个永远不能用自己的母语与电脑互动的社区,其语言在数字时代的生存几率停留在口头传统上的几代人。AI提供了前所未有的"语言保存"机会——因为你可以在训练集中注入所有已知的这种语言的文本和语音记录,让一个模型永久地学会说这种语言。


    % z! y+ N6 ^$ A4 o$ ]  K$ G4 h6 i- K: n

    但这也是TAIDE最脆弱的一层。小语种的训练数据极其有限——不是百万级网页,不是万本书籍,是几百小时的录音和几千页的文字记录。用这么少的数据训练一个有意义的语言模型,本身就是AI领域最困难的研究挑战之一。台湾的研究者正在尝试用迁移学习、数据增强和跨语言预训练来弥补这些缺口——但缺口是真实存在的。

    ! j9 y" }1 [/ B) C- X4 H2 Y9 q

    "价值对齐"作为一道防火墙
    % s! K0 Z  V/ |% }+ _- B9 b+ m4 Z

    TAIDE项目中有一个被公众讨论得最少的维度,但它可能是整个计划中最具政治战略意义的部分:防污染设计。

    当一个台湾开发者基于Qwen或ERNIE进行微调时——即使只使用了他们的模型权重——底层的"世界知识"仍然是中国互联网的产物。这些模型被训练为"不在特定话题上产生不符合中国法律的内容"。而中国法律关于台湾的立场——"台湾是中国领土不可分割的一部分"——是这些模型底层训练数据中不可移除的政治前提。

    . h; q+ p) U( H+ x* c

    TAIDE从数据层面切断了这个依赖链。它的训练管道只使用台湾来源的数据——台湾的院校刊物、台湾的媒体档案、台湾的政府出版物、台湾的社交媒体内容。它不是事后过滤,而是更早一步:从一开始就不摄入那些偏见可能存在的数据源。

    但"防污染"有一个悖论。TAIDE的目标之一是让模型能够"自由地讨论所有话题,不进行自我审查"。但一个完全不进行任何内容边界设定的AI——在台湾的民主语境中——仍然需要面对仇恨言论、虚假信息、国家安全敏感话题等治理挑战。"不审查"不等于"无规则"。而规则的设计——在自由的边界和滥用的危险之间划出红线——是各国主权AI都在挣扎但台湾的语境尤为敏感的问题。


    $ a" E8 {! f- t1 r+ E9 _9 d% w. M

    地缘政治的两端
    . T3 ^( e2 t2 X. N4 w4 w9 m

    TAIDE运行在一种高度紧绷的地缘政治张力上。

    " r2 R/ s( f( g' v& ^6 b

    在一端,台湾拥有台积电——地球上最重要的AI芯片制造设施。没有台积电的3纳米和4纳米工艺,NVIDIA的Blackwell GPU就不会存在。Jensen Huang将台积电描述为"地球上最重要的公司"——这不是夸张。这是对全球AI供应链脆弱性的最权威表述。


    " K; c: Z& h+ L8 `

    在另一端,台湾自身的AI训练算力极其有限。台湾国家高性能计算中心(NCHC)提供了Taiwania系列超级计算机,但这些系统的AI算力仍然远低于训练一个前沿大模型所需的规模。TAIDE的训练需要在台湾的有限本地资源和海外云服务的配合上达成平衡——而这又引入了潜在的依赖链问题。

    - j, q' n1 ~2 |& ~, T" t9 a/ `1 _

    "算力即国力"——这句话在台湾被政府官员和产业领袖反复引用。在这个维度上,台湾的"国力"是全球最强的之一——因为它制造了训练全球AI所需的几乎所有先进芯片。但这种国力不能直接转化为"训练台湾自己的AI模型"的能力。台积电不卖芯片给台湾政府用来训练TAIDE。台积电卖芯片给NVIDIA——然后台湾政府再从全球市场上买回由台积电代工的GPU。在这个循环中,台湾的半导体霸权是一种"间接主权":它不直接为台湾AI提供算力,但它让全世界对台湾的持续稳定运转产生了无法摆脱的依赖。


    - M; [3 l: V4 p

    当某个国家的主权AI需要用NVIDIA GPU运行时,这台GPU在物理上是由TSMC的Fab 18生产的。当那个国家质疑台湾的主权地位时,它用来运行政策的AI推理服务器里的芯片上,刻着的是台湾新竹的地址。

    3 y* A$ E- {( X. F# l- ?/ B

    台湾主权AI最底层、也最少被直接说出的博弈在这里:你用我的芯片来定义你——但如果没有我的芯片,你根本接触不到那个定义的原材料。

    芯片的悖论7 V8 v2 u' z+ G

    台湾在主权AI版图中的位置有一个深沉的悖论。

    " c; H9 y8 m. |# ~$ a

    台湾训练TAIDE的算力是有限的——它需要依赖美国云服务商,有时甚至需要通过NVIDIA的H100 GPU从海外获取。台湾本地的AI超级计算基础设施规模不大。

    2 }3 g! T% f8 y2 l: a

    但在地球另一端的台湾新竹科学园区里,台积电的Fab 18——全球最先进的芯片制造工厂——正在量产着为训练AI模型而设计的3纳米和4纳米GPU芯片。这些芯片——每一块上都刻着台积电"台湾制造"的标记——被装箱运往HPE、Dell、Supermicro的服务器组装线,然后安装在硅谷、西雅图、北京、深圳的数据中心里。


    4 y( @; z5 [: R$ Q% c& [( s

    台湾制造了全世界训练AI的芯片——但它用来训练自己主权AI的算力,可能还不到它制造出来的总AI算力的千分之一。 这是一个关于全球半导体分工的戏剧性错位:产能最大的一方,消费最小的一方。

    & b% P. z; N0 z  V

    "算力即国力"——这句话在台湾被政府官员和产业领袖反复引用。在这个维度上,台湾的"国力"是全球最强的之一。但这种国力不能直接转化为"训练台湾自己的AI模型"的能力——因为台积电不卖芯片给台湾政府用来训练TAIDE。台积电卖芯片给NVIDIA和AMD——然后台湾政府再从全球市场上买回由台积电代工的GPU。

    ; ]1 x" s& C$ e7 y( _2 }

    在这个循环中,台湾的半导体霸权是一种"间接主权":它不直接为台湾AI提供算力,但它让全世界——包括美国、中国、欧盟——对台湾的持续稳定运转产生了无法摆脱的依赖。当NVIDIA的CEO Jensen Huang反复说"台积电是地球上最重要的公司"时,他不是在夸赞——他是在承认一个事实:全球AI训练芯片的物理生产,集中在一个只有2400万人的岛屿上。

    台湾的主权AI不靠自己训练最强模型来证明存在,而是通过制造所有人训练模型所需的芯片,把自己嵌进全球AI系统的最底层。

    0 _  ^: R) ?3 ^


    评估:三种选择,四道考题算力从哪里来?8 s4 W, W3 B9 q" T) Z9 i' u

    三国共享同一困境:高端GPU全部依赖NVIDIA进口,无一国拥有国内GPU替代。

    3 s- }7 M1 m) l

    日本通过ABC(AI Bridging Cloud)基础设施和Fugaku超级计算机(ARM架构,不适合大多数AI训练)提供了一些国内算力——但总量不到全球高端AI GPU的2%。韩国拥有三星和SK海力士——全球HBM存储器的主宰者——但三星不生产AI训练GPU,SK海力士不设计任何AI芯片。台湾制造全球90%的AI训练GPU——但它的NCHC超级计算机只提供研究级的AI算力,不构成商业训练集群。


    # x3 \2 u) d3 o: Y/ Q5 q: R

    三国在算力层的"主权",很大程度上是一种购买主权:你有钱、你没有被制裁、你在美国的盟友名单上——所以你被允许购买NVIDIA的H100和B200。但"购买"不是"控制"。它是一根绳子——有弹性,但在某些方向上可以瞬间收紧。

    9 Z8 n5 G# f6 W7 g0 ~8 j( e

    钱从哪里来?! [0 w2 F8 V+ f3 Z

    混合模式,各有侧重。

    6 e, g; q& ~' E9 f8 Z9 O# p

    日本走的是"政府启动+硅谷VC跟投+本土产业资本"三路径。METI的GENIAC补贴计划提供数亿美元,Lux Capital和Khosla Ventures为Sakana注入硅谷级别的VC资金,NTT、KDDI、Sony作为本土战略投资者提供产业背书。Sakana在2025年11月的B轮融资后估值约27亿美元——对于一家日本AI初创公司来说,这是一个不可想象的数字。


    + _# J0 R* U: s: K9 H1 c' p, L

    韩国走的是"财阀主导+政府配投"模式。Naver Cloud、SK Telecom、LG AI Research、NC AI、Upstage——韩国的AI研发集中在既有科技集团、内容公司和少数高潜创业公司之间。政府的国家代表AI项目提供了相当于启动奖金的补贴——但与企业自己的AI投入相比,政府资金是补充性的。韩国的AI资本结构反映的是其产业的寡头特性:少数玩家,大规模内卷。

      ~6 Z8 x2 g  M# p" z( s0 q

    台湾走的是"学术公共资金"模式。TAIDE由NSTC预算出资,大学和研究中心联合执行,没有明显的私人资本的参与。这与中国的大基金模式、韩国的财阀模式、日本的VC模式都不同——台湾的主权AI资金来源是纯粹学术公共基金式的。这限制了规模——但也使得TAIDE不受任何单一商业利益的控制。

    . h, O# I5 \" W# Q

    技术怎么走?
    $ g& I, a2 P- @$ q. {# _& B

    三国在同一个"不从零训练"的前提下选择了三条完全不同的技术路径。


      S1 u" M; q% |& p3 g% F! m

    • 日本(Sakana):进化模型融合,自然启发算法。回避预训练竞争。在"已有模型之上创造新能力"的层面定义前沿。
    • 韩国(国家代表AI项目):独立训练/从零训练作为政治门槛,Naver Cloud案例显示外部组件会触发主权争议。追求"纯血"。
    • 台湾(TAIDE):基于开源模型的领域适配(台湾数据+繁体中文+本土语言),语言学驱动的数据工程。"纯血"在数据,不在模型。" B) s1 y1 {( q9 W4 t

      2 b5 p3 a9 F" W% e


    # @7 @7 K! v9 e& k% s: {8 D" b

    这三条路径完美地展示了"算力约束"如何催生技术路线的分化。如果日本有十万块H100,Sakana可能不会发明进化模型融合。如果韩国有无限GPU预算,"从零训练"就不会是一项需要被写进竞赛规则的"要求"——它只是一个默认选项。如果台湾有专属AI算力基础设施,TAIDE可能已经训练了一个从零开始的繁体中文多模态大模型。


    0 j) \+ q2 K  V6 C; E

    约束创造了多样性。富足催生了趋同。


    5 Q4 T% Y1 E4 g2 d. V  v% r

    最怕什么?
    & |) C+ X+ d9 g) _2 x% \" {, k

    三种恐惧,三重驱动。

    % Z8 q! d, |! q6 Q9 B' `

    • 日本最怕"再次错过"——这个国家已经错过了半导体、错过了消费电子、错过了互联网平台。AI是日本过去三十年失去的所有技术浪潮中的最新一个——也是最不能被错过的一个。Sakana的存在、Rapidus的2纳米工厂、政府AI补贴的空前规模——这一切的底层驱动是一种"不能再输"的焦虑。

    • 韩国最怕"技术不纯"——不是怕性能落后,是怕任何让韩国AI"不能被完全宣称为韩国AI"的技术依赖。Naver的争议之所以引发了比性能焦虑更深的舆论震动,是因为它触碰了一个更根本的韩国身份问题:在一个被大国技术全面渗透的世界里,"韩国制造"这个标签还能保证多少纯度?

    • 台湾最怕"语言被覆盖"——繁体中文被简体中文覆盖。台语被普通话覆盖。16种原住民族语言被遗忘覆盖。在台湾的AI主权地图上,最大的威胁不是一个外国的AI模型——是一个不会说你的语言的AI模型成为你的孩子和你的政府每天使用的默认工具。


      ; J% d& E) j! x# @2 N
      : C1 T, F4 O! ]! t5 m6 M7 x; ]

    终章:三种突围,一个命题  l% N* |& L& t

    日本、韩国、台湾——这三个东亚经济体在主权AI版图上共享一种处境:不够大,无法无视算力约束。不够小,无法接受永久的依赖。

    但它们各自选择了一个不同的支点:

    • 日本选择在算法哲学上突围。如果不能在算力层竞争,就在效率层、演化层、自然启发层改变AI的建造方式。Sakana AI的名字——"鱼"——不是随意的。它暗示着一种群集智慧:一大群小模型协同工作,胜过一只巨型模型单打独斗。

    • 韩国选择在技术纯度上突围。它用自己的"从零训练"标准,划出了一道政治与技术交叉的红线。这也许让它在短期内无法生产出"最好的"模型——但它生产出的模型是无可争议地属于韩国自己的。在一个被大国定义的AI世界里,"无可争议地属于自己"可能比"更好"具有更高的地缘价值。

    • 台湾选择在语言边界上突围。繁体中文、台语、客家话、原住民族语言——这些被全球主流AI生态系统性忽视的语言和字体,成为了台湾主权AI的"独家领域"。没有人会来竞争这些语言。因为这些语言的利润率太低。但正是这种"低利润率"——这种全球巨头不愿意投入的"非盈利性语言正义"——成为了台湾主权AI的防御纵深。


      % M) C4 T0 x6 n2 B) ^3 J+ v

      : |) t( N. L# D

    三种策略没有一个完全解决了算力约束的根本限制。日本仍然需要NVIDIA的GPU。韩国仍然在HBM上依赖全球供应链而非自主控制。台湾仍然无法直接将台积电的芯片产能转化为本地的AI训练算力。

    * i! n7 F2 O: d" `

    但这些策略都指向同一个问题:当一个国家的AI能力被结构性锁定在"不可能从零做全栈"的位置上时,主权不再只看"有没有",还要看"你到底有什么不同"。

    而在一个巨型模型越来越趋同于同一种"全球性英语思维"的时代,"不同"正在成为最稀缺的资源。

    1 o# c! u; T6 X/ `" ^1 e


    下一篇预告:《中东篇——把石油美元炼成算力美元》


    本文是《全球主权AI实验室巡礼》系列第三篇。下一期将转向中东,剖析沙特如何将2026年定为"人工智能年"、阿联酋G42如何在微软投资与中国切割之间走钢丝——以及石油美元如何正在被重新铸造为算力美元。


    & k3 \9 v9 g' |  H+ I9 {& ?  d0 e% O( Y. f

    点评

    油墨: 5.0 油菜: 5.0
    给力: 5.0 涨姿势: 5.0
    油墨: 5 油菜: 5 给力: 5 涨姿势: 5
    难怪台湾部分没法过审  发表于 4 天前

    评分

    参与人数 1爱元 +15 收起 理由
    mezhan + 15

    查看全部评分

    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2026-6-22 16:54 , Processed in 0.135071 second(s), 20 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表