TA的每日心情 | 开心 2020-4-8 10:45 |
|---|
签到天数: 227 天 [LV.7]分神
|
玻璃之翼降临——Glasswing计划与Claude的Mythos Preview
* d. u U- g& |# i" Q* \2 X6 w& R% ~
, b% W8 h% T, v一个预览版的AI大模型刚刚挖出了一个尘封27年的漏洞,然后11家科技巨头都坐不住了……
7 A, o) M6 M$ w" A3 y, s' R. l+ g! r/ y( u' f0 p
故事是这样的。4 V7 [: l8 U& S9 Z0 z; _. s
8 H' [) T# L x% c" T5 }$ p
我今天看到这个新闻,看完之后愣了好几秒。
8 y+ W f+ R1 Q- E/ @" c
! u) I0 u: N8 q' L* D$ \" ]5 F1 D一家叫OpenBSD的公司——做操作系统的,算是安全领域的老前辈——他们有一个漏洞,在代码里躺了整整27年。1998年写进去的,没人发现。
; H3 a, B9 r! Y% x7 i$ c8 t7 p6 M. ?
+ |2 E7 V- t! H; L结果被一个AI模型给挖出来了。& g# d2 o, l' W. \# T9 V3 d, L
4 B3 K8 J" o* f2 X0 ~0 Q% U1 \
这肯定不是那种"我们用AI扫了一下代码库发现了问题"的挖出来。而是那种"这个漏洞藏在最核心的地方,所有传统工具都扫过5百万次,一次都没报过警"的条件下挖出来。
# E, e/ Z. L1 v2 ]. v3 ~
: N G3 v. R3 Y5 b' s/ r然后,这个AI模型,顺手还把FFmpeg里一个16年的漏洞也给挖了。6 s r' k/ ~7 b0 T
/ |4 }( H* |: w) Y# p9 A X+ Z/ r! HFFmpeg,音视频处理领域最最最核心的基础设施。全世界的视频播放器、浏览器、直播平台,有几个不是建立在FFmpeg之上的?这个漏洞在里面藏了16年。5百万次自动化测试,没一次报过警。( R7 P# x6 z1 V5 K" }* Q9 V
* M# q+ h8 s" \. }5 p+ V
然后呢?
" L1 Z' H$ `& Y! s
9 {# r- K* z/ Q5 Z2 O4 J然后,11家全球最大的科技公司——Google、Microsoft、Apple、NVIDIA、CrowdStrike、JPMorganChase、Google等等——坐下来,说了一句话:我们一起出钱,让这个AI模型,能被全世界的安全研究员用上。% k3 z) r8 d& T+ }) B9 W$ g
- _) C: a, o! A
这个项目,叫Glasswing。
; J% E5 y8 x3 @& [
! `% M; n# E8 U) V/ g# V8 B Aglasswing
' A1 w+ E# q9 [4 ?& e
+ L0 `0 [* ~0 N) h- I( B
( H$ e0 q1 v+ x先说清楚Glasswing是什么。8 t- Q, l1 \; u, ` J' K! F
' V7 f( D) x8 `+ @) l' p简单说,它是一个AI安全联盟。发起方是Anthropic,加入方是一堆哪怕是不关注技术领域也叫得出名字的科技巨头。它的核心,是一个叫Claude Mythos Preview的模型——注意是Preview(预览版),就是还没正式发布的那个版本——专门训练来挖漏洞的。6 c: [" M4 R' s! l# e6 \9 }# D1 e" \
8 a# J- i, s) F; G# Z) X; H
有多强呢?
# Y9 ?' _' j1 n/ d) ]; W6 P- Z6 l. q8 X! z
CyberGym基准测试,83.1%。作为对比,Claude Opus 4.6,得分是66.6%。不是Claude Opus 4.5,是Claude Opus 4.6,Anthropic目前最强模型。
; r8 [' F. u* c! d4 _% O+ @7 d
9 U9 V7 N F6 l( j- D4 f7 r/ e; m* {SWE-bench Verified,93.9%。还是SWE-bench Verified,不是那个容易一点的版本。Claude Opus 4.6是80.8%。
, V! S: m) ^% A8 s2 ^4 o, F. ^+ F" U. I5 F
差了13个百分点。
1 A+ [% j) t2 {. A) w3 j. R" H* S/ P8 e
你说这13个百分点意味着什么?+ k" G6 P4 H/ ^* y
1 b! g* ~5 u6 Y( e: l
意味着,传统扫描工具漏掉的那些最刁钻的漏洞——那些藏在层层调用关系里、藏在异常分支里、藏在并发边界条件里的漏洞——Mythos Preview能找到。
9 _0 G k- ^1 f7 R1 ?# a. l1 [8 ]( U) s6 d7 \4 H
意味着,27年的OpenBSD,16年的FFmpeg,以后可能不会再有了。
6 Y: h8 Z1 D/ Y# t! G
' B- O% z2 M Q0 W9 F( `或者说,这种级别的漏洞发现速度,会比以前快几个数量级。
7 N# a- a+ T1 H- u1 W% R. @( e
9 t" L f' c# J4 n* {# |说到这个OpenBSD的漏洞,我必须展开讲一下,因为这个例子太有意思了。; u' K3 F+ `, v6 a1 p& D3 x
) C- J/ }7 c2 T% fOpenBSD是个什么存在?9 Z8 _, u8 M/ c! c* N, M3 K' L
0 [ C6 Y$ K- R- S1 V9 s* e
它是BSD操作系统的一个分支,最核心的设计哲学就是安全。代码审计之严格,在整个开源社区都是有名的。很多安全研究员的信仰级操作系统。
( `6 K% L5 H( @) {& _& M$ r* C3 O& | s; I
这样的项目,代码审计了多少年了?二十多年。. ~- |' q6 L1 \" ^$ G9 e
! q P4 I2 h5 R3 X# ]然后,一个漏洞,在里面躺了27年。
( b- {' Q8 a3 R1 r/ h) t! h9 q) l# S1 R: U; \0 a' c6 G. n2 l
这说明什么?
* y2 j9 u! _1 L3 [& N1 V- q3 L8 n' w S" W* [* a
不是OpenBSD的人不行,是传统的审计方式有盲区。任何人工审计,只要时间足够长、人足够累、代码足够复杂,就一定会有漏洞漏过去。这是人性的边界,不是能力的边界。3 L' f7 f' A2 R/ v7 F. P$ G1 Z$ a
( n) r% h3 y" e2 B5 K7 s
但AI不一样。AI不会累。AI不会因为审了三个月之后注意力下降。AI可以在几个小时之内,把整个代码库的所有调用路径、所有边界条件全部穷举一遍。4 m5 J6 l. m1 o* n4 H% A% L6 H
S! c2 h9 R; f, |
Mythos Preview发现的那个OpenBSD漏洞,是一个本地权限提升漏洞。攻击者如果已经拿到了一点点访问权限,可以利用这个漏洞进一步提升到root权限。
6 W7 f2 i, A5 ^# |0 x# ?
8 m, S$ f! q" ^6 N1 L; T这种漏洞可怕在哪?# V" y$ m3 |9 y% @0 [
/ e6 c9 C6 _- l, i1 O" y它不显眼。它不是那种"输入框里填个单引号就弹shell"的漏洞。它需要你对系统有相当深的理解,才能构造出触发条件。7 E k: }: D! P/ J# ]
, M6 N2 p! l7 o5 d3 m
传统扫描工具扫不出来,是因为它的payload模式不在规则库里。AI不一样,AI学的是语义理解,它不是匹配特征,它是理解代码在"想什么"。/ R6 M" ?" z8 \2 E
/ _! d% W( W y- f4 w
FFmpeg那个例子更让我震撼。
) E+ l3 o' s7 g8 H% c3 P N) [
4 r' @/ z, h' Z$ b5 S16年。4 l& G) a" m$ V2 w
& d+ ?: D7 q7 XFFmpeg上一次发现这种级别的漏洞是什么时候?2009年。- a$ S% r9 P' ^- v* y/ m& i
5 ?- F( n$ S) ? h) U6 T
16年都没有人发现。然后Mythos Preview扫了一下,找到了。# \. R0 r2 E5 w" w$ }# e1 t
+ O$ X$ H! D* E, U, P# Y2 D注意这个"扫了一下"的背景。SWE-bench测试集里,有大量是真实世界里的bug修复历史。FFmpeg这个bug在历史上真实存在过,是某次修复的时候被记录下来的。这意味着,Mythos Preview不仅能做代码审计,它能做的是:从海量代码里,识别出"这个写法有问题,即使目前还没有人报告过"。
5 S$ y( L- _: Y. T! C8 F- L
% l% d; t) Z- W1 I5 O7 b/ T这是主动防御,不是被动响应。
7 ?0 v: P! E1 M$ q4 M, h/ x% p- s
# B* D( Q6 q8 }) X传统安全的方式是:出了事 → 分析样本 → 提取特征 → 更新规则库 → 下次能识别。) b1 x$ j: D3 u" B9 t% g6 f' C
4 y& k" S4 l& i3 \4 UAI安全的方式是:不需要样本。直接读代码,告诉你这里有个洞。
4 N6 y* R5 S- U1 o
) `' t- `- N Z/ V. h7 i这两者之间的差距,大概就是"等贼来了再装防盗门"和"在盖楼的时候看着图纸就告诉你这堵墙扛不住地震"的差距。
4 r" _/ S) n# B6 ~1 _* \, b+ |; C* e9 \! o) \$ @
现在说说大家最关心的问题:谁能用到,怎么用,花多少钱。4 H) n5 C0 u" K" Q) b; b
4 p5 r& K- O, w0 a- N3 }Glasswing的AI能力,现在跑在三个平台上:Amazon Bedrock、Google Vertex AI、Microsoft Foundry。$ u4 }: J: G/ t' [! D3 L& G( f2 k
+ q8 C# T; v7 c, X这三个平台,恰好是AWS、Google Cloud、Azure。全球三大云服务商。
3 |! K( |& Y# o i* F. W9 Y$ H9 K0 m. d; [" O6 o! }
你在任何一个上面,都能调用Mythos Preview的漏洞检测能力。
' c" h! M: S7 k. F4 K8 B# }: u
) E0 H) S3 Y+ q价格呢?过了初始的credits之后,每百万token输入25美元,每百万token输出125美元。2 O" f1 V( X: g2 d' S }, W" y" w
1 }5 h, c2 E4 G/ J- |4 Z: f这个价格贵不贵?( F/ L2 ? o: _' }' ^' T/ l4 A8 g
0 b- E2 H! N+ l) A# i R6 i
对比一下就知道了。现在市面上做代码安全扫描的工具,像Snyk、Veracode这一类,商业扫描工具的报价大概是每个开发者每个月几十到几百美元不等。而且它们扫的是规则匹配,不是语义理解。3 W1 I/ S1 O2 T" D# s# y. R
d8 a" p; k2 P1 h: lMythos Preview能发现那些工具发现不了的漏洞。
$ T9 Z. L1 ?2 V" I
0 b+ p/ h& b' G/ ~- m% [! h* S这不是贵不贵的问题了,这是"有没有意识到你以前省的那些钱其实在交更多的学费"的问题。
( j' {3 h) x* a0 \& U! p& o; \0 P4 ^) s9 g% v7 R
另外,Anthropic自己掏了1个亿美元的使用额度,分给联盟成员和开源社区。还额外捐了400万,250万给Alpha-Omega/OpenSSF,150万给Apache软件基金会。
e/ f+ Y% O, X% W" p+ k- ` ~) u, k; ` S
这些钱是用来干什么的?让那些没有商业利益驱动的开源项目,也能用上最好的漏洞检测能力。
; ~4 p( T+ D* t& t2 R+ B' `3 t8 `5 j9 F1 j! T
FFmpeg就是开源的。OpenBSD也是开源的。这些项目没人给他们钱做安全审计,但他们的代码,运行在全球几十亿台设备上。! G7 W# C5 \8 o/ T" e4 p0 d
' ? j: Z! C/ z/ C
还有一个细节,我觉得特别有意思。
" z# K* z: o6 a: J0 A1 ^
" J) p5 Z( y! r- X0 ~, [) F漏洞发现之后,公开披露的时间是90天。
+ o% k0 i) N! Q, i I! o
3 ^- n" Z# a# G4 T- H0 `8 q90天是什么概念?! K. ~/ z. a/ a9 w. l: Z; r3 {
( Y+ Q5 R' d/ j5 Z- {* K: i行业标准的漏洞披露窗口是90天。这个时间足够让厂商评估漏洞、制定修复方案、推送更新,但又不至于让漏洞在黑市上流通太久。& h0 ]3 Y+ W! e* i' z/ q
; L6 P. R, n* P/ r但这里有一个问题:90天是针对"有人发现了漏洞"这个前提来说的。$ r2 W. F1 P6 x3 b4 B
' F) i0 y. x2 ~ z3 i1 B6 d
Mythos Preview现在能以前所未有的速度挖出漏洞。它一天挖出来的漏洞,可能比以前整个安全社区一个月挖的还多。
& X5 _! Q; S! h+ v5 o# M( N' l9 Y2 T. G
7 L7 U* r$ _2 K+ ^这意味着,漏洞披露的节奏,整个就变了。% w; B, b+ N, ]: P2 l2 o# m
6 V9 J+ U! l- ^8 d5 J! o B6 f& ]
以前是"挖到一个,披露一个"。现在是"AI在持续不断地挖,每90天披露一批"。
4 _' p( m6 d4 Q3 z) _; H' O
6 P1 a* S. A1 u4 m7 U5 z% x厂商的补丁开发速度,能不能跟上AI的发现速度?
3 [0 {, ^) _7 E, B4 c! B: M" \9 z v, f
这个,我说实话,不知道。但我觉得,这是整个Glasswing项目最值得观察的地方之一。9 ]4 a$ I9 p* A; a: m c- v
4 t5 {: m5 Z' j3 x% h9 H q- P0 Z
写到这儿,我突然想到了一个更大的问题。
0 I7 J6 M7 h, W( V$ q A' E) a! V) J& \
/ i- ^9 s+ F5 \. q1 p7 E" UGlasswing这个名字,本身就是一只蝴蝶的名字。玻璃翼蝴蝶。它的翅膀是透明的,像玻璃一样。. G7 @ I% v9 E8 G5 k
( Q3 c t! H" P! `% U+ D透明,意味着隐藏的东西变可见了。
7 c- l9 t( @# f$ W7 Y5 y3 x3 ?. Q5 |
0 k l6 f Z- X# O* m一只蝴蝶的翅膀是透明的,它就隐藏不了任何东西了。它在哪里,飞向哪里,所有捕食者都看得清清楚楚。
( V% G' h2 S! U; h2 D2 a( b) h. h* ?
这个意象,放在漏洞挖掘上,太精准了。
- ]5 r/ a& x8 Y' |* B- y/ A8 M) U3 R" j
. p, |2 t/ n' |+ Q. d, J3 F代码里那些隐藏了几十年都没人发现的漏洞,在AI的"眼睛"之下,突然就透明了。
8 p9 X% v1 u3 [# ]- v
4 \) F5 _: v5 o8 y- O9 J+ G以前我们说"security through obscurity"——通过隐藏来保证安全。你的代码不公开,漏洞藏在暗处,攻击者找不到。
' \; l3 c3 t7 m/ G% h/ ^2 n! B8 e) c& h0 X& ^5 i
但现在,只要代码存在,AI就能读。Mythos Preview不需要你的代码是开源的,它只需要能接触到代码——不管是源码、还是编译后的二进制、还是运行时的行为轨迹。. ]* M4 D% e8 U: @. {' x5 p
1 [- `8 m0 X/ N+ H, R" Q+ B代码越来越难藏了。或者说,代码里的漏洞越来越难藏了。
$ t& J" V7 a6 ` C! O. F3 O$ n1 o. w7 @
这是一件好事吗?$ X& R% A' r2 j4 Q! B( r1 o
1 x8 U" G4 _* K. Q' g8 `
我觉得,短期内,这是一件非常非常好的事。
5 m" o$ i% U3 G6 b3 I& |
7 Q# d- H: u: ?' S& i& s$ Q全球互联网基础设施里,有多少代码是10年、20年、30年前写的?没人敢审计、没人敢动、出了问题就打补丁接着跑的,有多少?
7 O: N0 d6 x# y- m* M/ z( e2 n) H# A% x
这些代码就像一颗颗定时炸弹,埋在整个数字世界的基础里。7 @2 o" r. Z5 ]8 q5 d
6 m0 s5 T/ \! l7 IAI能做的是,帮我们把这些炸弹找出来,一颗一颗地拆除。
$ X6 ?) f* l P q
9 G8 a$ x" D+ T1 t8 {但长期呢?
7 c4 M3 ?; U4 _: b/ ]
, J4 n: n/ U8 n1 E! A) e当所有可见的漏洞都被AI清除干净之后,剩下的,是什么样的世界?
8 U! u. p6 ]" O- T1 W5 I! r/ A( v1 ]9 I( X& Y' |' y) Z3 D
是代码质量极高、安全性极强的一个世界?还是所有攻击者也在用同样的AI,攻击的速度和防守的速度同步提升的一个世界?) {0 v: R( p' b6 F5 q2 ~$ L
% L4 N$ C, z: V. N我也不知道。
9 J+ N$ } R9 Q- Z2 C& Y0 A% y2 h! L L$ g) E& Z& H
但有一件事我特别想强调。
& b! @+ R5 Z0 _# s/ ^0 z3 ~5 M r8 t' n( z) Y
这次Glasswing联盟里,有JPMorganChase,有CrowdStrike,有Palo Alto Networks。这些公司,是真正的安全重度用户。$ X8 a5 k" {0 x5 {* G. {: a) @
) o2 d" X$ a ]+ m. o( D他们自己有能力挖漏洞吗?当然有。JPMorganChase的安全团队在全球排前列。CrowdStrike就是做安全的。 j' I) w+ [5 T' n2 C/ ]
$ f8 L8 k" {1 q4 |1 T6 R2 z* h他们为什么还要加入这个联盟,用别人的AI?
1 J6 d4 ~/ Z \& N9 {" Y4 }2 `0 L$ r! r# u% f
我大胆猜测一下:因为挖漏洞这件事,规模太大了。5 Z( R% q$ D: m! n7 Q/ d
) {0 E% f, `+ j7 g全球代码量太大了。每一家公司,即使安全团队再强,也只能覆盖自己的代码库。但外面的供应链、开源组件、合作伙伴的代码,你根本管不到。. c }0 r7 e8 S9 Z" |7 A5 e9 l$ a- e, Z
4 ]6 c7 b( g$ pMythos Preview的价值,不在于它比你的安全团队强。而在于它能同时扫所有地方。
* i3 q( u; O3 G0 q, o7 y( i
2 I4 i& }0 w; v. W这是规模效应。 g4 O/ n2 P z1 f; N& @
6 L- C0 \- F* J" i- Y4 ]就像打补丁。手工打补丁,你只能打你知道的那些机器。自动化打补丁,你能打你所有的机器。AI扫漏洞,相当于在每一个代码提交的时候,就自动扫一遍。% v5 C! n( Y: e
1 H# \' j# ?; [ j9 K* J% v/ J
这个规模,是人类团队根本无法覆盖的。
f+ O& {7 Q/ _, F
6 b/ G! I* ?6 M0 Z8 `Glasswing这个项目,还有可能往一个方向发展——成为一个独立的第三方机构。
0 X* A! T' k; x9 v
- @- E& E) H% a2 [6 u什么意思?
. I/ ^2 W4 e. `
, @! o' H1 P+ b' X% h4 X5 W+ {现在它还是Anthropic牵头、11家公司参与的联盟。但未来,它可能变成一个真正独立于任何商业公司的安全机构。它的评估结果,有公信力;它的漏洞报告,有权威性;它给出的安全评级,整个行业认。
2 e2 L* @- W( k+ y1 X6 i9 }( ], w- h# D& p( K3 X7 p8 w
类似现在的ISO认证,但针对的是代码安全。
/ u$ C- u4 v% v! }# {! S! q% `
8 L% \: B4 F% D; m& T& Y3 a6 A, }想想这个画面。未来的软件采购,合同里可能不只要写"符合SOC2",还要写"通过Glasswing认证,漏洞数为0"。
/ F5 y, g2 Z/ `1 K g& n+ d% ~ h' a3 `: U( z+ i
这不是不可能的。
3 ?: ` s$ i$ {" z& U" ^$ c) R% G* n4 L4 J
当然,路还很长。现在还只是第一步。但方向是对的。# R5 w+ ^% G: f- R3 T+ e
6 i. `3 i P( o8 V: ~! Y" G h# T
好了,写了这么多,让我最后说几句掏心窝的话。$ s$ M+ `1 R$ i" t
4 |: z; r- ] ^' v( x我这次看到Glasswing的新闻,第一个反应是兴奋,第二个反应是有点怕。
! C! X" ~; X* Z% O& x: o! O9 O$ m t! J4 R+ C( i& a2 O6 B
兴奋是因为,我真的觉得,这是AI在安全领域做的最有价值的一件事。以前我们聊AI安全,大家想的都是"AI能不能被攻击"——对抗样本、数据投毒、模型劫持。这些很重要,但离普通开发者很远。
$ D+ [" t4 f8 x( b
/ |4 \$ k$ q) j' E. _' d这次不一样。这次是AI在帮我们发现自己的脆弱点。- B3 _+ _2 Q7 `$ }
- m# d: J- W. Q) Y% K: {这种脆弱点,我们以前不知道,或者知道但没有能力发现。AI把它们挖出来,摆在阳光下,告诉你这里需要修。
: ?2 _7 u% y+ u$ e" A* z0 `+ X9 o0 M/ O7 h
这是AI在补人类的短板。不是在超越人类,是在帮助人类补上人类自己够不到的地方。
# i) E8 F7 P1 Y$ P4 X6 x
$ P5 ~2 s) }; r: t/ P, b) A我怕的是什么呢?( h2 r8 p q8 } G' R% k3 d
& v F# \( r& m# H
我怕的是,这个工具,只有大公司用得起。
2 v+ W$ u- f2 I9 y, s+ X* H2 G$ ], y
AWS、Google、Microsoft,Bedrock、Vertex AI、Foundry。这些平台,都是商业平台。Cloudflare这种中型公司,可能用起来没问题。但那些真正需要安全检测的——初创公司、开源项目、十几人的小团队——他们能用到吗?
$ ^6 T# b7 ]; V S
2 A* Z$ h$ b& Q. _) d# {( F( I' ZAnthropic捐的那1亿美元额度够用多久?分到全世界的开源项目上,每个项目能分到多少?
# D! k5 g8 h$ I9 Q N# p: m: M$ Z* X. m4 U, T3 }6 i# S, _* U
这些问题,现在还没有答案。
! W2 M' U9 _) Z- b" [
/ J. w$ f) C' O8 x* W但有一点我特别想强调。
' A* s: C2 G: v* L y5 O7 n* ^
6 R% A/ a+ l- \- BGlasswing这个项目,让安全这件事,第一次真正有了一种"基础设施"的可能性。
) {0 ^2 z# d" P1 r" f; a8 f5 W
6 y8 Z5 \. {* s# u以前的安全,是奢侈品。你要么雇得起安全团队,要么买得起企业级扫描工具,要么你就裸奔。" X3 q$ k1 c% d2 D$ A( ]7 d
0 W$ `; d9 X0 nAI改变了这个等式。Mythos Preview能发现那些企业级工具发现不了的漏洞,但它的调用成本,并没有比那些工具贵多少。! s7 l. h/ ~+ h
! l% D( G t- E4 h- Z
当漏洞挖掘的成本持续下降,当AI扫描变成每一个代码仓库的标配,我们或许真的会迎来一个更安全的互联网。
j$ v5 Z) l# G8 L# O! v+ v. q- a. X0 W$ I3 R
这一天什么时候来?我不知道。可能5年,可能10年。/ h* U) t. v7 f6 y1 b2 t8 G
6 u9 I" u+ _7 T7 ^$ R3 x但Glasswing,让我第一次觉得,这件事不是痴人说梦了。" n& Y0 i; O) B, d2 e S
|
评分
-
查看全部评分
|