|
|
本帖最后由 晨枫 于 2026-5-29 09:23 编辑 7 t" U( Z6 r6 Y. ^/ W- L0 {
% s) I" m& S8 F) @) k都说AI定义第四次工业革命,这已经成为未来几十年甚至更长时间的科技发展和国家兴衰的关键。DeepSeek推出新的大模型,在业界又一次引起轰动。华为也整了一个大活,推出τ定律。这俩成为中国AI革命的哼哈二将。
+ R; ~) C, ]" ?& w$ z- J' f8 [" E0 E) X* w/ B7 }* y
DeepSeek打破芯片算力的局限,用更加精妙的算法和策略实现了高性能、低成本,这是“架构优先”的技术路线。尽管很多关键技术都未必是DS首创,但有效整合并做到高性能、低成本,还是无可置疑的成就。西方惊呼“斯普特尼克时刻”是有道理的,DS更是在本来就优质优价的基础上,用永久降价证明了高性能、低成本所言不虚。
+ @4 f. c- F: n3 M1 ~+ e6 Y1 a% a7 \' a- T
华为的τ定律在芯片技术方面也实现了“架构优先”,将在芯片技术方面引起DS一级的撼动,不过西方自己也“斯普特尼克时刻”疲劳了,这一次没有再用这个说法。( \% Y! e% U/ D! K/ q8 \
+ N( ]* [; C. j# b1 S7 B$ H* @
τ定律用上了τ,这最初是自控里对时间常数的说法。在自控里,时间常数是用来描述动态过程“本质惰性”的关键参数。" p( z: L- a# k0 O: E2 r
& c+ `/ G) ~: I& G* R6 |6 S6 M* o2 [![]()
3 P! j1 I! X$ I* u" n8 F0 \) O
$ L/ W- p& ]$ k) {# E实际物理过程发生变化都是需要时间的。开汽车的时候,一脚油门到底,速度上升有一个过程,最终达到极速。高铁极速更高,但提速更慢。提速快慢可以用时间常数来描述。
/ x7 X) s: X+ C9 o/ @% f0 `& A1 H4 g2 y* ~5 U
在数学上,对于一阶过程,时间常数是输出上升到63.2%终值所需要的时间。也就是说,不管你怎么做,上升(或者下降)不可能更快了。
+ }" V( C6 }; z$ `, S; G6 q2 N% F' t E+ {/ e6 R9 @ M
华为的τ定律就是要缩短时间常数。不是靠打破物理定律,而是靠另辟蹊径。: A, B+ k" Q5 [( Q* P9 N! Z
0 i7 \; U; r( b在某种意义上,从28nm到14nm到7nm到5nm到3nm到2nm,这是节点越造越小。也可以反过来理解,好比大平层越造越大,同一个单元里可以容纳的房间和功能越来越多。单元往大里造本身就是挑战,但房间到房间的路径也越来越长了,再优化也短不了。
3 L4 p/ [8 r# h5 _1 _# ^
2 [2 y3 L, i% P华为则是造多层。不再在一层的面积上多纠结,一层不够造两层,两层不够造三层,加起来,可容纳的房间和功能也越来越多。7 e# D* L8 a8 D) u
- s ^6 I) Z ^+ ~' a
但多层有多层的造法。单元楼的每一层的平面设计都是一样的,所以只需要有限几个楼梯、电梯就可以楼上楼下沟通。但楼上楼下走动还是需要在层内首先走到楼梯间上下,然后再在另一层内走到需要的房间、从事需要的功能。时间需要较长。这是现在多层封装的路子,已经用在高带宽存储器(HBM)等上面。
1 |) z* s8 C. m' m' ~
" \9 A7 f& V Y7 C# f u0 z* \华为则打破每层的平面设计相同的局限,各层都按照楼上楼下全盘最优设计,不仅平面设计不同,楼梯、电梯也灵活布置,哪里需要就在哪里开一个。这样,房间里就楼上楼下直通,路径和所需时间极大缩短。这才是τ定律。- G. \9 W) v- E1 |. m% d+ m0 s6 @
+ i G9 v5 }- L% M; g
τ定律的关键技术是逻辑折叠,把组合逻辑与时序逻辑垂直拆分到不同的有源层上,通过亚2微米间距的混合键合,把上下两层晶圆直接连起来。组合逻辑好比来单出货的小铺,来什么单出什么货。时序逻辑好比在统一指挥下的项目组,到什么时间、到哪一步干什么活。组合逻辑与时序逻辑相结合,才能完成各种功能,但两者的特性不一样,比如说,时序逻辑需要储存记忆装置,记住上一个甚至更早的状态,组合逻辑就没有这个需要。种种差别决定了将组合逻辑和时序逻辑拆分到不同的有源层上更合理,当然这个合理是在两层之间还要畅通的基础上,否则就是聋子和瞎子还分处两室了。
0 l: H; b% G# m, S1 w1 c
) i. Y7 C( h5 X4 f5 O# b这在设计、工艺、测试上带来巨多挑战。但华为不仅把理论跑通了,还依据τ定律设计了381款芯片,打通了从设计到制造到封装到测试的路线。这里面肯定有很多用来试手但没有太大工艺和技术价值的芯片,不过用于下一代华为手机的麒麟2026、麒麟2027已经流片了,这就不是小打小闹的试手了,而是规模生产的大宗主流芯片。先前的华为7nm一直有功耗偏高、发热偏大的问题,麒麟2026、麒麟2027有望解决。
+ l! N; R) x0 L- _
1 q, H% ~; p1 }- T9 a4 l华为计划在2030年达到1.4nm等效的芯片性能,这将弯道超车,赶上在2028年才可能落地的台积电1.4nm技术。3 m* W$ z7 X5 S& d* _) x7 E
' ~+ e! m5 H% b b华为做得到吗?在没有落地之前,一切怀疑都是合理的。不过到现在为止,华为要么先做后说,要么说到做到。在给出明确的路线图和时间表的情况下,有理由相信华为能说到做到。, }; J. c' r0 b) e
+ _3 K8 R: i+ [, ?手机芯片还是牛刀初试,AI芯片才是主攻。一旦攻破,中国AI就彻底起飞了。“AI赋能”将是制造业全链的效能倍增器,使得中国这个制造业唯一超级大国成为超超级大国。什么是超超级大国?呃,比超级还要超级吧。火力发电可以从超临界到超超临界,大国也可以从超级变为超超级嘛。
" W) I# z% ]1 }: `. z+ c# K9 P I& `4 c Y" Z" C5 G( U3 I
或许这才是黄仁勋跟着特朗普访华,但对H200售华一无所获的原因。中国很清楚美国想借最后的机会窗口抢占AI生态地盘的意图。中国现有AI芯片尽管性能只是够用,DS降价说明数量也够用了。够用就是够用,还做不到超越,但守住生态更重要。在中国先进芯片即将落地的时候,没有必要做48年投敌的蠢事。黄仁勋哀叹英伟达的中国份额丢了95%,就看他剩下的5%还能拿多久了。% }: Y/ Z6 p) I/ ]7 W2 k3 O, E
6 n) Q0 @+ L. ]$ r& c
但DeepSeek和华为在两个截然不同的方向上证明了中国科技发展的特点。
' j7 j' B* s+ k6 U% z- z' ^3 W% T/ Y9 {7 U! c5 C, Z
DeepSeek在一鸣惊人之前,是个默默无闻的小公司。如今也只是名气大、影响大,但公司本身并不大,据说只有一二百人,核心团队只有三五十人,主要骨干来自国内院校。2 x: e! g+ _( j1 [; C0 d
8 n" h! i+ |/ t6 }: d5 M( s
DeepSeek的成功彻底打破了“中国人缺乏科技原创活力”的迷思,也打破了中国只能靠输入人才才能发展前沿科技的迷思。这两点都对美国的“小院高墙”战略都是致命的。小院高墙只能针对个别实体,否则就把自己关进小院高墙了。对科技交流和人才培养关门上锁也不能放慢中国科技发展,反而促进中国发展出独立、内生、高韧性、可持续的自主科技生态,不仅摆脱对美国主导的科技生态的依赖,也打断了对美国主导的科技生态的回馈。
( B" `1 X5 i) [( _
K% A. R% @/ s9 o* f要紧的是,DeepSeek不是一个人在战斗,无数小微科技公司像雨后春笋,在各种行业里迅速出现。有见光死的,更有茁壮成长的。他们提供了不可思议的科技活力,这是自下而上的路线,将成为支撑中国科技革命的一条强有力的腿。
/ k |; u+ o% v) v# G8 F- L$ w0 |/ Q% O# Q
华为截然相反。这是财力、技术、人才实力都非常雄厚的大公司,更是垂直整合的大公司。说起来,华为的垂直整合是被美国的封锁和制裁逼出来的。本来华为在愉快地用着Google全家桶和海思设计、台积电代工的芯片,但美国的极端制裁迫使华为大力发展垂直整合,海思成为全球设计公司里少有(可能是独有)的软件栈自己做、指令集自己定义、关键IP自己掌控、SoC集成自己扛、互联协议自己推、先进封装和3D集成自己打通的一家。这条路当然很苦,但苦到最后会形成一种很特殊的技能点——"从指令集到散热膏"的全栈联合调优能力。7 w, [9 ]' M" B k
2 B8 q/ i. f# u7 ^5 ]$ `" Z
也正因为这样的垂直整合,使得高度依赖时间协调、空间对齐的逻辑折叠能够落地。传统模式的模块化路线有平行推进、交替迭代的好处,但也受到条块分割的局限,难以做到τ定律所要求的全局最优化。. x. Z) Z2 C. y. H
% Y9 K+ c2 U! z+ I/ _0 ?这决定了在中国,也只有华为这样的少数超级集团军走得通这样的技术路线。这是大兵团作战,擅长攻坚、死守,目标明确,计划严谨,资源到位,配套落地,在自己攻坚的同时,掩护并起的群雄到处攻城略地。这是自上而下的路线,这是支撑中国科技革命的另一条强有力的腿。
N, ] C# V2 u; D9 Q; J
- p+ z0 ?1 G3 O% ?9 u, f这样的两条腿走路给予中国科技革命以不可思议的韧性、自主性、内生性和活力。
/ g, B) a7 f0 C. x; @3 ?# \! ]6 i& X
/ V& Y* M, p" _! K5 ^" P2 U& G& e在欧美,英伟达这样的Fabless公司很难打破供应商的条块,而推动全局最优化。IBM可能在理论上还有这样的可能,但廉颇老矣,尚能饭否?想当年,美国半导体可是遍地英雄啊,英特尔、AMD、TI、IBM、National Semiconductors、Motorola、Sun Microsystems、Hewlett Packard、DEC、Data General,如果超出半导体,还有GE、Xerox、Honeywell、Bell Lab、Kodak,化工还有3M、杜邦、道化学、……。" D; e0 a: R3 x) i4 H2 r: X/ u4 Y
5 t$ b8 T/ r `; R3 v; z0 O& `/ s4 L而且华为能用DUV(还不一定是先进DOV)做到相当于EUV的性能,这不仅打破了性能天花板,更是砸破了成本地板。DUV的运作成本比EUV要低得多,而且华为解决了良率问题,中低端走量手机就是例证,良率不达标是没法走量而不亏得底儿掉的。2 L: C% \# c0 B. E% _! M/ q
2 F( L$ p3 ^( N% a
不要忘记,中国的先进DUV和EUV也在路上,落地很可能也不晚于2030年。EUV与逻辑折叠不冲突。两者互相加成,那就是乘法的效果。已经有EUV的西方在理论上也能得益,问题是要先学会做乘法。
1 l' A: o. ?5 p a3 f- n- j! A4 L. g, `$ T
在大球里,有个人突破和团队配合两大路线。在冷战时代,体育也政治化了,个人突破成为西方路线的代表,团队配合成为东方路线的代表,尽管实际上谁都是两者结合的。在科技发展上也一样,有美国式野生、自发、充满活力的风险投资模式,和中国式国家主导的工业政策模式,刻板、坚定,目光远大,无坚不摧,不计代价。实际上谁都两者结合。但一般都是把两大路线看作互不交集的。4 E$ r7 Y f, j1 Z7 }6 U
; j# S( S" F7 v) WDeepSeek和华为的例子表明,中国根本不顾这些定见,“英雄不问出处”,怎么管用怎么来,而且两条腿都走出精彩。! ?$ w. ~; I( g( _, G$ b# }, A P
5 D, U; \* X4 g' \" {! _1 `. s现在轮到西方反思了:一条腿的蹦跶总是比不过两条腿走路,时间一长必定现原形,但西方还能两条腿走路吗? |
评分
-
查看全部评分
|