TA的每日心情 | 开心 2020-4-8 10:45 |
|---|
签到天数: 227 天 [LV.7]分神
|
玻璃之翼降临——Glasswing计划与Claude的Mythos Preview( E' z5 A. x/ V
. S3 z4 w6 n9 l3 V
4 E, F6 F& h q' X3 W2 @& l一个预览版的AI大模型刚刚挖出了一个尘封27年的漏洞,然后11家科技巨头都坐不住了……
- g/ {. X. ~. o5 \$ t* X" w: H0 ]. b! e' Z) h" {! K
故事是这样的。% K! g/ g. w% ?% e5 |! y
/ A ]; G3 f( D5 S0 `4 u2 S8 Z/ ?我今天看到这个新闻,看完之后愣了好几秒。
4 W( M7 u9 U7 V) b/ \+ U: C; j( {* f+ w7 a) i
一家叫OpenBSD的公司——做操作系统的,算是安全领域的老前辈——他们有一个漏洞,在代码里躺了整整27年。1998年写进去的,没人发现。, c" Y8 d' \4 l/ A' @# e/ b$ `
% q% X5 q$ }* m7 Z
结果被一个AI模型给挖出来了。
$ [' w" L7 O# J9 s8 ^& @
: U! b3 I) }8 A这肯定不是那种"我们用AI扫了一下代码库发现了问题"的挖出来。而是那种"这个漏洞藏在最核心的地方,所有传统工具都扫过5百万次,一次都没报过警"的条件下挖出来。
5 ^6 F6 |, S2 c# ~
" w0 @/ X& b9 U- w6 C5 k% C然后,这个AI模型,顺手还把FFmpeg里一个16年的漏洞也给挖了。
" G7 D8 I) [' V) a9 P
, i; V0 |# p5 ?FFmpeg,音视频处理领域最最最核心的基础设施。全世界的视频播放器、浏览器、直播平台,有几个不是建立在FFmpeg之上的?这个漏洞在里面藏了16年。5百万次自动化测试,没一次报过警。5 i" _6 F3 w7 A% F: b% t8 e$ t# `
/ S9 [+ I+ b; z. X9 U3 A; }
然后呢?
/ f3 s% l7 d f4 F9 i) k4 X! {# H- ~) b2 {! B" E P# r3 {$ n. O
然后,11家全球最大的科技公司——Google、Microsoft、Apple、NVIDIA、CrowdStrike、JPMorganChase、Google等等——坐下来,说了一句话:我们一起出钱,让这个AI模型,能被全世界的安全研究员用上。
! H3 h: H8 o( ]6 h
% K) S6 j. F% ~3 E0 g这个项目,叫Glasswing。$ P Z7 n$ F N' L0 h! v5 F! J# D# B
7 x. X; m, N4 D U- s8 ~' @) v bglasswing3 Y7 b- z* w8 z6 f1 k+ u2 w3 X# v
; i' l/ z! y7 ]0 ?1 }: D% C, f8 ]1 X) |
先说清楚Glasswing是什么。/ l/ Q8 w: X* |+ C( W. f& ~
- r m" E9 J( {- M. G) d简单说,它是一个AI安全联盟。发起方是Anthropic,加入方是一堆哪怕是不关注技术领域也叫得出名字的科技巨头。它的核心,是一个叫Claude Mythos Preview的模型——注意是Preview(预览版),就是还没正式发布的那个版本——专门训练来挖漏洞的。
% j* i" Q R7 T3 _. \: f e2 j# q! @/ H% \0 k" K
有多强呢?* y" g j; i: q2 L) e
e* E7 T- I) A. s% P8 GCyberGym基准测试,83.1%。作为对比,Claude Opus 4.6,得分是66.6%。不是Claude Opus 4.5,是Claude Opus 4.6,Anthropic目前最强模型。
9 R& V# I* `5 l. a! y7 [1 h5 q" a6 ~+ l# k( @8 c+ i- c( P
SWE-bench Verified,93.9%。还是SWE-bench Verified,不是那个容易一点的版本。Claude Opus 4.6是80.8%。$ Z; e( x5 L! G) R# {# m
& {: c* L d$ C: g2 X差了13个百分点。
% g. t X8 c3 N7 k1 n' T
5 ]4 V6 h# {9 t& r) \& o4 e: _; |* q你说这13个百分点意味着什么?
' D t2 H* ~! M( I1 Z1 U& y( X3 n5 R) e/ r
意味着,传统扫描工具漏掉的那些最刁钻的漏洞——那些藏在层层调用关系里、藏在异常分支里、藏在并发边界条件里的漏洞——Mythos Preview能找到。 P$ P$ V& h6 }4 k# N2 [
8 W7 E$ y5 ]; O5 W
意味着,27年的OpenBSD,16年的FFmpeg,以后可能不会再有了。7 o0 A, d/ {- x- }# \/ S
8 m+ d7 [; E3 @! X3 J/ h或者说,这种级别的漏洞发现速度,会比以前快几个数量级。6 m8 y2 p8 G, d" H! E0 ~: z
' x; P1 g6 M0 H- e说到这个OpenBSD的漏洞,我必须展开讲一下,因为这个例子太有意思了。
; T8 a% `6 |9 ^' ]" V& A8 K
% y0 W: A" Y1 C5 D8 tOpenBSD是个什么存在?* a) i: s8 l' \/ e/ A" S" e' X
% U4 ~ l9 H$ A! s% D7 \它是BSD操作系统的一个分支,最核心的设计哲学就是安全。代码审计之严格,在整个开源社区都是有名的。很多安全研究员的信仰级操作系统。
4 z$ Q. u7 H, D. E! V
6 j2 K/ V7 H+ X1 o0 H8 F这样的项目,代码审计了多少年了?二十多年。$ h7 t6 }2 u+ [3 x) a
" @5 _5 D; n: I7 z
然后,一个漏洞,在里面躺了27年。$ K' n: E" m4 d, V
" T% p2 ]/ q5 a: F8 s" t# n
这说明什么?" l: e C& i2 n1 X7 K; D. z
) J) @8 I9 v/ j/ Q" d$ ~9 x, w
不是OpenBSD的人不行,是传统的审计方式有盲区。任何人工审计,只要时间足够长、人足够累、代码足够复杂,就一定会有漏洞漏过去。这是人性的边界,不是能力的边界。7 J1 d- W3 Q. d" p7 ?; O1 i& O
) _, Z! n- ]% `1 |但AI不一样。AI不会累。AI不会因为审了三个月之后注意力下降。AI可以在几个小时之内,把整个代码库的所有调用路径、所有边界条件全部穷举一遍。# b) o, h, E( B! a8 x. s
5 q; |* U' i2 g9 u+ AMythos Preview发现的那个OpenBSD漏洞,是一个本地权限提升漏洞。攻击者如果已经拿到了一点点访问权限,可以利用这个漏洞进一步提升到root权限。
W: T1 E% Z* W3 C) c0 |/ I3 [' P' v7 I
这种漏洞可怕在哪?
/ L: j# E z! a
0 d3 j/ N& N( d7 M$ V" d* O4 W! ]$ D它不显眼。它不是那种"输入框里填个单引号就弹shell"的漏洞。它需要你对系统有相当深的理解,才能构造出触发条件。, L3 C$ m) `/ A6 l) o7 d, V
8 V% y3 Q+ w% A7 H
传统扫描工具扫不出来,是因为它的payload模式不在规则库里。AI不一样,AI学的是语义理解,它不是匹配特征,它是理解代码在"想什么"。& m8 E6 ]+ ?5 d9 Q" o
$ P+ X. {& e( ?1 x, Q5 Z
FFmpeg那个例子更让我震撼。
% j0 n" f8 F k6 |- O5 h
5 B7 k7 [3 k0 [) R1 l5 e16年。$ F: V- I* T; g8 x
/ F3 A+ ?) Z) v- l6 UFFmpeg上一次发现这种级别的漏洞是什么时候?2009年。
% e5 p( T! v! f" h# i4 ?0 V% J; K
9 @1 L1 i0 n" v; [6 t+ d16年都没有人发现。然后Mythos Preview扫了一下,找到了。
- I ~- H! h% H; K0 U3 Z" u" U& h3 f4 U3 Q T" D$ {
注意这个"扫了一下"的背景。SWE-bench测试集里,有大量是真实世界里的bug修复历史。FFmpeg这个bug在历史上真实存在过,是某次修复的时候被记录下来的。这意味着,Mythos Preview不仅能做代码审计,它能做的是:从海量代码里,识别出"这个写法有问题,即使目前还没有人报告过"。
) T2 ^4 M9 B/ B& a! K+ `) A* A- H
这是主动防御,不是被动响应。$ z4 C* E9 Z% ^1 L% z1 v/ b7 }
; `2 J) M6 a, v& A/ B2 f传统安全的方式是:出了事 → 分析样本 → 提取特征 → 更新规则库 → 下次能识别。3 v+ ?: m: u* y4 W- w
, U5 J7 s; a; F) TAI安全的方式是:不需要样本。直接读代码,告诉你这里有个洞。& P; d1 X' }" a4 S: ~0 O
1 A* m( k! u& y) j" |# J5 J这两者之间的差距,大概就是"等贼来了再装防盗门"和"在盖楼的时候看着图纸就告诉你这堵墙扛不住地震"的差距。
% G: h! r- E( I4 r$ }' m7 @* m+ Q
. T* b2 f; ]7 r+ x O. G( C% b现在说说大家最关心的问题:谁能用到,怎么用,花多少钱。4 G, P- r, A) N: e
4 ^- f* r/ f( l1 X2 X5 W4 Q" j6 K
Glasswing的AI能力,现在跑在三个平台上:Amazon Bedrock、Google Vertex AI、Microsoft Foundry。
" ^, M* K4 c$ i7 d9 O( W4 q
( Y/ c- M7 b* M% k* k这三个平台,恰好是AWS、Google Cloud、Azure。全球三大云服务商。 p0 q) Y# j. e& ^6 i9 n5 A- D
; |+ t1 R. N5 Y/ n3 }
你在任何一个上面,都能调用Mythos Preview的漏洞检测能力。
1 I+ w' w# r! E" ?: y" K0 W% w
. m2 w, V- Z' q) h( y价格呢?过了初始的credits之后,每百万token输入25美元,每百万token输出125美元。
3 N! e$ d" O* ^' j' v) b5 Y$ ]# G9 o& c
这个价格贵不贵?
8 @. q: V) t( X3 T& X1 I
o, H2 {+ G9 C7 V( M( p9 w对比一下就知道了。现在市面上做代码安全扫描的工具,像Snyk、Veracode这一类,商业扫描工具的报价大概是每个开发者每个月几十到几百美元不等。而且它们扫的是规则匹配,不是语义理解。
6 N4 c( Q5 k6 W/ |
# w4 G% j6 A& W' g( g* L) d3 uMythos Preview能发现那些工具发现不了的漏洞。& R. L9 B/ I3 |5 C* L/ {7 c
% ?9 X a3 k- N- h0 M这不是贵不贵的问题了,这是"有没有意识到你以前省的那些钱其实在交更多的学费"的问题。
7 g4 W1 y1 }! j4 _( ^( p9 u' R
) R% u7 q3 ? Q( {0 {另外,Anthropic自己掏了1个亿美元的使用额度,分给联盟成员和开源社区。还额外捐了400万,250万给Alpha-Omega/OpenSSF,150万给Apache软件基金会。) x2 g2 K1 T; o4 `
1 Z7 E9 a. R% t
这些钱是用来干什么的?让那些没有商业利益驱动的开源项目,也能用上最好的漏洞检测能力。6 {% G1 \& s' D7 N0 Y
7 ~0 @- A# y0 e3 u
FFmpeg就是开源的。OpenBSD也是开源的。这些项目没人给他们钱做安全审计,但他们的代码,运行在全球几十亿台设备上。+ p# d% C. J) v8 D7 y
- i/ N2 b) q4 _9 A1 V
还有一个细节,我觉得特别有意思。5 X0 g& Y! _* ]. p
' u6 W* k2 d, e
漏洞发现之后,公开披露的时间是90天。- z: x7 }' f8 w, F
; n7 U' k( |- I G. _) r2 l90天是什么概念?
/ {) ^# {4 V' I; z/ e: i. b B# I0 l
行业标准的漏洞披露窗口是90天。这个时间足够让厂商评估漏洞、制定修复方案、推送更新,但又不至于让漏洞在黑市上流通太久。
' a l8 Y0 y# w# v+ X; w# O ] w/ C7 ?
但这里有一个问题:90天是针对"有人发现了漏洞"这个前提来说的。5 z1 a. j G0 V, ^, y/ R1 W. O
9 G" S4 m" L( E% A; ^4 l% X5 C& ]6 `
Mythos Preview现在能以前所未有的速度挖出漏洞。它一天挖出来的漏洞,可能比以前整个安全社区一个月挖的还多。
- u: ]5 W7 J9 F* H( I" d& X7 z q
' Q9 B$ W$ R& q F4 `; k# p6 e; \这意味着,漏洞披露的节奏,整个就变了。
9 Q/ Q: v8 G9 Q3 t
! g- @( u, Y3 Y# |5 C& ~以前是"挖到一个,披露一个"。现在是"AI在持续不断地挖,每90天披露一批"。" g8 B- W" L5 @; I1 A0 G$ u6 N
/ d. r6 A, e) ~, L' o厂商的补丁开发速度,能不能跟上AI的发现速度?
) P! d. S6 p# F5 i- v- Z4 j) L* P: e3 U
这个,我说实话,不知道。但我觉得,这是整个Glasswing项目最值得观察的地方之一。
2 n9 O5 z# \ J: z
# g5 Q# k5 o6 h/ ~6 k4 D# `写到这儿,我突然想到了一个更大的问题。) i0 N/ v: A- G r4 ~
8 S2 i/ K: ^ t2 [; x% ?2 ~2 L8 G. L
Glasswing这个名字,本身就是一只蝴蝶的名字。玻璃翼蝴蝶。它的翅膀是透明的,像玻璃一样。
5 l6 k: } g9 S0 w# p
/ V% }3 A! r; \2 B5 O透明,意味着隐藏的东西变可见了。
( _: B& b. ~( J$ G! r1 z; O, q. U. ^3 n. d
一只蝴蝶的翅膀是透明的,它就隐藏不了任何东西了。它在哪里,飞向哪里,所有捕食者都看得清清楚楚。
8 M! s9 Q9 m/ G6 x1 x8 W: m! {" E( b- k3 \
这个意象,放在漏洞挖掘上,太精准了。8 L+ R, w n7 A3 W+ G- a$ X! ~% i
; B% u9 ^& M Z6 t8 Z9 h代码里那些隐藏了几十年都没人发现的漏洞,在AI的"眼睛"之下,突然就透明了。
' p2 ~- J* q' X( n
! a' V2 _' H1 u7 C/ Q以前我们说"security through obscurity"——通过隐藏来保证安全。你的代码不公开,漏洞藏在暗处,攻击者找不到。
4 P5 Z9 Q3 m$ w" R, I; @7 [+ F' k& t2 p6 b
但现在,只要代码存在,AI就能读。Mythos Preview不需要你的代码是开源的,它只需要能接触到代码——不管是源码、还是编译后的二进制、还是运行时的行为轨迹。* k9 P; S8 ~$ O! w; w
% d5 _/ g- _! x1 b6 Z
代码越来越难藏了。或者说,代码里的漏洞越来越难藏了。
9 X% L. e9 O; _1 ^
) s t: n% W" q: m2 v这是一件好事吗?" @6 V& y/ R. s$ z5 x
+ B+ z) D9 P0 L" F6 r我觉得,短期内,这是一件非常非常好的事。
) L$ g4 }6 h" u" ^: M+ k+ F
, n+ t3 m$ C$ R; N' f4 } d全球互联网基础设施里,有多少代码是10年、20年、30年前写的?没人敢审计、没人敢动、出了问题就打补丁接着跑的,有多少?, d7 f! I; d8 {. X1 f$ q- _( W
) T, [6 G9 g/ m- h# R这些代码就像一颗颗定时炸弹,埋在整个数字世界的基础里。1 V8 U" @, O% p m' |
2 p+ _$ K; B! Z; K) n2 B1 AAI能做的是,帮我们把这些炸弹找出来,一颗一颗地拆除。
6 h2 n0 ?) q* q1 N
+ a2 D5 c* _" V: I, {但长期呢?' f' _' O* V1 ?+ c/ i A8 ]
2 A2 H9 ^' s& N% i( K当所有可见的漏洞都被AI清除干净之后,剩下的,是什么样的世界?# ]: j; j: t4 d% W: x b z
# Q( G* G" Z7 F4 g/ N# T4 F是代码质量极高、安全性极强的一个世界?还是所有攻击者也在用同样的AI,攻击的速度和防守的速度同步提升的一个世界?
+ d6 i* Z3 \0 E c
: h, I$ w5 U; v8 ^我也不知道。" G( [+ ~5 I( \8 k+ p/ H' a% b0 U
6 A4 n7 s9 J% i% s$ |0 E- g+ b
但有一件事我特别想强调。
" E2 l+ F. h$ v
: Y* M. p1 J' G( M( a4 A8 U这次Glasswing联盟里,有JPMorganChase,有CrowdStrike,有Palo Alto Networks。这些公司,是真正的安全重度用户。6 A1 d+ b. |+ ]" N" q% ~
! d" X1 O9 X, K" x( b# I他们自己有能力挖漏洞吗?当然有。JPMorganChase的安全团队在全球排前列。CrowdStrike就是做安全的。
8 T7 E/ G1 H: N5 Y6 Q5 W0 S2 i! S3 o
他们为什么还要加入这个联盟,用别人的AI?
# d5 v" S. X" s+ m `& E, e
' U* t Y+ _4 h' u( ~' [我大胆猜测一下:因为挖漏洞这件事,规模太大了。
! u) H; M+ N4 ?" n. N5 D
7 [ ~% L# @, `6 ]. p全球代码量太大了。每一家公司,即使安全团队再强,也只能覆盖自己的代码库。但外面的供应链、开源组件、合作伙伴的代码,你根本管不到。
! u M6 L# B& T) Q W
$ U' h4 F& b) iMythos Preview的价值,不在于它比你的安全团队强。而在于它能同时扫所有地方。
5 w$ g8 F1 P6 s5 D( `
4 {3 J5 @3 @5 Q3 P: }这是规模效应。: H3 J4 H, \ e# }* }2 |2 T
{/ S( i5 L, D9 _' y7 J- r
就像打补丁。手工打补丁,你只能打你知道的那些机器。自动化打补丁,你能打你所有的机器。AI扫漏洞,相当于在每一个代码提交的时候,就自动扫一遍。/ C2 \5 J2 `; S5 v) ]5 u$ ]0 _
% p8 }( w! i6 o& U a* K4 j这个规模,是人类团队根本无法覆盖的。
2 x7 Y6 ^( E9 c; [+ v7 H% e6 Q2 |, h+ }( k
Glasswing这个项目,还有可能往一个方向发展——成为一个独立的第三方机构。
9 k1 ^ b" C; ]* {8 K# w" F% I! |! J/ p k
什么意思?& O- }4 r% {% b N0 N
* y1 V& Q' z' B6 M现在它还是Anthropic牵头、11家公司参与的联盟。但未来,它可能变成一个真正独立于任何商业公司的安全机构。它的评估结果,有公信力;它的漏洞报告,有权威性;它给出的安全评级,整个行业认。3 o& L0 {" B2 N) i) m g4 p
: H9 [7 a" J- ? Q! B( q
类似现在的ISO认证,但针对的是代码安全。. @/ l/ E6 j* `3 R5 q0 d4 w
4 k( x3 B7 c$ R& d+ c( `
想想这个画面。未来的软件采购,合同里可能不只要写"符合SOC2",还要写"通过Glasswing认证,漏洞数为0"。( e, F- k0 R, X4 h. C, Y4 e6 @
' i; G. z- z |" ~+ i% z
这不是不可能的。
5 g! a6 p- D0 ?/ L( z- V4 |7 [6 G E5 w' U5 M
当然,路还很长。现在还只是第一步。但方向是对的。
' K" D4 a: S2 s1 ?5 W2 L
$ e* a0 v C! |8 u( D. }/ I好了,写了这么多,让我最后说几句掏心窝的话。/ p' r" Y, t0 {
( O' I1 v& H5 ~2 c& L
我这次看到Glasswing的新闻,第一个反应是兴奋,第二个反应是有点怕。+ j: A. G( R- t5 S
! J6 u: B, B, }' F% y
兴奋是因为,我真的觉得,这是AI在安全领域做的最有价值的一件事。以前我们聊AI安全,大家想的都是"AI能不能被攻击"——对抗样本、数据投毒、模型劫持。这些很重要,但离普通开发者很远。
0 m. g6 [2 c! {' n' H0 {
. Q1 G( T0 L+ r这次不一样。这次是AI在帮我们发现自己的脆弱点。; }2 t( f9 x# a/ U* z: g: C/ V
- \6 @( t; {( z/ y* r- {* c1 f) }
这种脆弱点,我们以前不知道,或者知道但没有能力发现。AI把它们挖出来,摆在阳光下,告诉你这里需要修。7 d" t" f- j; C+ H2 u; v$ M
# \+ J$ X# K& @
这是AI在补人类的短板。不是在超越人类,是在帮助人类补上人类自己够不到的地方。+ f4 J" @( k6 h, D
1 q/ S2 \+ Z4 ]: z) i# X+ w
我怕的是什么呢?
4 s1 h$ n2 ^: v6 X
7 C: f4 R) [. R3 b* _" a6 D# I我怕的是,这个工具,只有大公司用得起。5 k! t, F8 s, z1 z) M F6 K! {6 H' s
8 S9 O$ L9 x7 [5 t! |
AWS、Google、Microsoft,Bedrock、Vertex AI、Foundry。这些平台,都是商业平台。Cloudflare这种中型公司,可能用起来没问题。但那些真正需要安全检测的——初创公司、开源项目、十几人的小团队——他们能用到吗?8 z! A- l5 x7 w5 U) V
3 \7 x6 A2 q0 ?+ _- s. V ~Anthropic捐的那1亿美元额度够用多久?分到全世界的开源项目上,每个项目能分到多少?
. E% L' k$ _' `/ m1 g/ G2 v
3 ^7 N f# i8 T1 M2 y这些问题,现在还没有答案。7 W! ]. A% D6 v* G; p2 u
, c% U2 Q& E* T$ h% G+ ^! [ n4 G/ |
但有一点我特别想强调。5 E( \) [" e% ]: _% ]
$ W3 D" b0 Z& {
Glasswing这个项目,让安全这件事,第一次真正有了一种"基础设施"的可能性。; \' y0 I* i0 a- t$ P. G6 L
/ w9 M% s' R) A
以前的安全,是奢侈品。你要么雇得起安全团队,要么买得起企业级扫描工具,要么你就裸奔。
3 G1 k" t( K$ J9 X2 Z' a
/ ]8 }, [$ h4 JAI改变了这个等式。Mythos Preview能发现那些企业级工具发现不了的漏洞,但它的调用成本,并没有比那些工具贵多少。/ p- r e) a5 ?- b3 D3 L
$ h' I/ x* @ P' n当漏洞挖掘的成本持续下降,当AI扫描变成每一个代码仓库的标配,我们或许真的会迎来一个更安全的互联网。$ N) m% \: H2 C+ ^- I$ L0 Z, w
' |( n( A, G4 h
这一天什么时候来?我不知道。可能5年,可能10年。9 I/ H* k6 F4 e- R$ w9 S
. Y! C( L% e9 n3 l" U3 A* o
但Glasswing,让我第一次觉得,这件事不是痴人说梦了。
# F% X. g( A- T3 {' [ |
评分
-
查看全部评分
|