TA的每日心情 | 开心 2020-4-8 10:45 |
|---|
签到天数: 227 天 [LV.7]分神
|
玻璃之翼降临——Glasswing计划与Claude的Mythos Preview8 B) z9 c$ F5 Q1 r/ f
! ^9 Z$ H: W+ t& I9 n/ i3 P& X7 z8 ^7 }. k; J. E) I% d
一个预览版的AI大模型刚刚挖出了一个尘封27年的漏洞,然后11家科技巨头都坐不住了…… R3 l0 |- i, g! X& J
6 f& n5 f( g* O* l+ h& j
故事是这样的。3 `' @8 g: ^- _1 M0 P; R) U% ~
. p, C& e j: ^6 H+ m+ W+ `我今天看到这个新闻,看完之后愣了好几秒。
' s4 M& q( H2 C
, S% j) y! ^8 [一家叫OpenBSD的公司——做操作系统的,算是安全领域的老前辈——他们有一个漏洞,在代码里躺了整整27年。1998年写进去的,没人发现。
1 w g+ D/ I2 Y" `
4 Q" A7 G/ E6 }2 l结果被一个AI模型给挖出来了。2 A5 u" Y6 z4 L) z6 y s3 ^
7 W3 |& }- t6 s( `
这肯定不是那种"我们用AI扫了一下代码库发现了问题"的挖出来。而是那种"这个漏洞藏在最核心的地方,所有传统工具都扫过5百万次,一次都没报过警"的条件下挖出来。# o7 |' `! a- b
: l* j. P( t7 \% N$ |
然后,这个AI模型,顺手还把FFmpeg里一个16年的漏洞也给挖了。
8 Y/ c1 i. _, \* [- M3 w8 j3 h. k. y; y+ y* u3 O# K- B
FFmpeg,音视频处理领域最最最核心的基础设施。全世界的视频播放器、浏览器、直播平台,有几个不是建立在FFmpeg之上的?这个漏洞在里面藏了16年。5百万次自动化测试,没一次报过警。
6 c; f$ P& Y/ g/ r; ~
) G% h8 ^* U+ T然后呢?
/ x }% J3 u- z9 R' t$ a* d+ V
! [3 Z1 W& F: y: {# b( H' o然后,11家全球最大的科技公司——Google、Microsoft、Apple、NVIDIA、CrowdStrike、JPMorganChase、Google等等——坐下来,说了一句话:我们一起出钱,让这个AI模型,能被全世界的安全研究员用上。
; L& s( x/ v4 P7 Q2 A( ~: Y+ k* }# j/ k8 q6 j" T
这个项目,叫Glasswing。6 F5 o9 ~. d8 Y) K2 g
2 o8 z6 s I! K6 [! K. S
glasswing1 }& _1 u/ o, u
& g6 _" F. o, Q' _/ |
8 L @. ?/ y+ a' q先说清楚Glasswing是什么。
3 O1 P' @, t1 L! r
+ T/ r5 X1 p8 b. d5 Q% B简单说,它是一个AI安全联盟。发起方是Anthropic,加入方是一堆哪怕是不关注技术领域也叫得出名字的科技巨头。它的核心,是一个叫Claude Mythos Preview的模型——注意是Preview(预览版),就是还没正式发布的那个版本——专门训练来挖漏洞的。
1 d. d" m" s1 L% `0 |$ K4 H/ O& j/ b4 s. o! R( G: Y0 R, ]$ g
有多强呢?
& A3 U7 Z& {( Q w* x: O" B6 @, ?9 X4 V( ?( e4 ^' {
CyberGym基准测试,83.1%。作为对比,Claude Opus 4.6,得分是66.6%。不是Claude Opus 4.5,是Claude Opus 4.6,Anthropic目前最强模型。
8 A( d3 `3 Q% F- p
, \- P! l/ e- q) \6 Q- OSWE-bench Verified,93.9%。还是SWE-bench Verified,不是那个容易一点的版本。Claude Opus 4.6是80.8%。. l! g/ h0 M e2 ~
1 X& J' Y+ t1 F) V; S/ ~- ^5 t
差了13个百分点。
+ H# p. n- U- ^; m6 C
' U5 k% T" j! g0 J4 l- ~: m: k你说这13个百分点意味着什么?3 K& c% U: Q9 q G& I/ H. b( s* H! D
" }; |% k6 ]5 A( u
意味着,传统扫描工具漏掉的那些最刁钻的漏洞——那些藏在层层调用关系里、藏在异常分支里、藏在并发边界条件里的漏洞——Mythos Preview能找到。
7 C \* J2 B. T* z: k* ^, t, {9 Y3 V
9 J3 R2 G' X9 A# \意味着,27年的OpenBSD,16年的FFmpeg,以后可能不会再有了。% Y3 O! b5 Q) d5 o4 N- |
) D o' o& a7 G, H# L& j或者说,这种级别的漏洞发现速度,会比以前快几个数量级。9 p/ I8 z3 [/ i, \# \. A: |
0 ]8 h* b& ~; i" i) G0 g- i2 d说到这个OpenBSD的漏洞,我必须展开讲一下,因为这个例子太有意思了。
9 c( }2 G$ R a) @, y9 t
1 I) D; Y% A8 A9 b* t0 kOpenBSD是个什么存在?0 ~+ O* x+ Q7 P( F* {0 I+ Z, S) S
" n, P: ?. o- U l U! b
它是BSD操作系统的一个分支,最核心的设计哲学就是安全。代码审计之严格,在整个开源社区都是有名的。很多安全研究员的信仰级操作系统。" w7 M' g0 v8 n* e. d: F
( p; S8 h r; G这样的项目,代码审计了多少年了?二十多年。
) @& i- O5 j1 r: g
; t* a& I2 A& t然后,一个漏洞,在里面躺了27年。 }- B' }- Y4 r9 q/ h4 o/ ^
0 Z- Y2 x5 u& m/ r这说明什么?2 `! i% Z* W& L. Y& L
# Z+ N! {# P0 `6 P8 ^' U, [不是OpenBSD的人不行,是传统的审计方式有盲区。任何人工审计,只要时间足够长、人足够累、代码足够复杂,就一定会有漏洞漏过去。这是人性的边界,不是能力的边界。) \5 b5 S/ C0 t6 H, n$ I
$ `+ U. C! B) y2 e* f: X0 d
但AI不一样。AI不会累。AI不会因为审了三个月之后注意力下降。AI可以在几个小时之内,把整个代码库的所有调用路径、所有边界条件全部穷举一遍。
{" k1 F5 c2 |; \2 C2 y+ f. F+ e* l* ^ p% l6 X7 Z
Mythos Preview发现的那个OpenBSD漏洞,是一个本地权限提升漏洞。攻击者如果已经拿到了一点点访问权限,可以利用这个漏洞进一步提升到root权限。8 B1 |/ d1 R9 `" ~
# [1 k1 h1 \1 E5 m+ {* o这种漏洞可怕在哪?. P3 i, ^ u9 c+ \& e6 v/ U
6 \! _# a* r% Q( z' a! H
它不显眼。它不是那种"输入框里填个单引号就弹shell"的漏洞。它需要你对系统有相当深的理解,才能构造出触发条件。+ i- F+ x! x8 h9 @2 q
+ Y; N" B+ Z- p/ x5 O) D& {# N8 X
传统扫描工具扫不出来,是因为它的payload模式不在规则库里。AI不一样,AI学的是语义理解,它不是匹配特征,它是理解代码在"想什么"。7 I% N' U4 J3 Q% F* B
9 }, g9 q$ j0 R! h5 h& F7 ^9 `FFmpeg那个例子更让我震撼。
4 f5 r, S0 O& G: k/ a! E, c$ ~, n+ C; b9 I- k/ ]! p# F% _
16年。
3 Q6 m$ m$ x% v d! K, _: i* t3 D( ]: O8 d; Y6 @
FFmpeg上一次发现这种级别的漏洞是什么时候?2009年。3 g, g3 j% f! W6 j1 S
& P u4 y1 L) B4 M0 ?* T3 k8 e
16年都没有人发现。然后Mythos Preview扫了一下,找到了。7 d4 ?1 k0 ?0 P/ V: J! M+ R3 W
. n% n O# i0 m$ M" n注意这个"扫了一下"的背景。SWE-bench测试集里,有大量是真实世界里的bug修复历史。FFmpeg这个bug在历史上真实存在过,是某次修复的时候被记录下来的。这意味着,Mythos Preview不仅能做代码审计,它能做的是:从海量代码里,识别出"这个写法有问题,即使目前还没有人报告过"。* d4 }% h+ a7 b: o( q0 {: K# f
' P; j( L1 {4 i1 u8 I Z0 B
这是主动防御,不是被动响应。" o4 _" u. T# V8 k
% y' K6 N# |3 Q( t: R/ f. ]5 w传统安全的方式是:出了事 → 分析样本 → 提取特征 → 更新规则库 → 下次能识别。
/ ~7 @2 K) }4 e" G+ ^" g8 m0 ]% [3 c9 S7 r+ q2 Q1 w
AI安全的方式是:不需要样本。直接读代码,告诉你这里有个洞。
, I( E) W6 v3 E
/ k- V* w) h2 T3 w H- u U这两者之间的差距,大概就是"等贼来了再装防盗门"和"在盖楼的时候看着图纸就告诉你这堵墙扛不住地震"的差距。( {1 `& q4 E. g5 }2 m
_8 p, z: S1 u$ ^( ?$ F- ~现在说说大家最关心的问题:谁能用到,怎么用,花多少钱。
5 O8 G4 q2 u4 p$ F( j
3 Z0 M& q0 [6 p/ NGlasswing的AI能力,现在跑在三个平台上:Amazon Bedrock、Google Vertex AI、Microsoft Foundry。
% q) p0 m: S: x% H0 ~' V* F' b+ n0 C7 m& c0 }7 j# \
这三个平台,恰好是AWS、Google Cloud、Azure。全球三大云服务商。
9 B w9 w' K6 g
- j! n3 q6 Q; R. @5 Q5 `- H你在任何一个上面,都能调用Mythos Preview的漏洞检测能力。
+ F+ b9 R! g' i( M& b/ `% |: I5 _& q# X# K: l9 Q
价格呢?过了初始的credits之后,每百万token输入25美元,每百万token输出125美元。8 o- T6 d1 S% G5 l
0 [- `: }" o/ z$ T6 z) f, B! |这个价格贵不贵?0 X: V% C7 s5 r0 u& }! R
- {4 y$ O, L' A! }7 B# [对比一下就知道了。现在市面上做代码安全扫描的工具,像Snyk、Veracode这一类,商业扫描工具的报价大概是每个开发者每个月几十到几百美元不等。而且它们扫的是规则匹配,不是语义理解。+ V$ U" ?7 p5 {, p/ \& l8 o
5 E6 P- k* i7 n2 C9 l. D; j
Mythos Preview能发现那些工具发现不了的漏洞。( ]- u/ N# \, R( K% @" q
% P. Q2 v1 o9 j6 p5 z* D9 |
这不是贵不贵的问题了,这是"有没有意识到你以前省的那些钱其实在交更多的学费"的问题。* f9 D3 i9 G. j+ m: M, f" i) }+ M1 X
: s. X6 n; @3 S! y; ?1 D# R
另外,Anthropic自己掏了1个亿美元的使用额度,分给联盟成员和开源社区。还额外捐了400万,250万给Alpha-Omega/OpenSSF,150万给Apache软件基金会。8 E% C/ y5 L3 g; A5 e! y4 w
# ^; `& ^3 e4 z2 C, s这些钱是用来干什么的?让那些没有商业利益驱动的开源项目,也能用上最好的漏洞检测能力。
]. T t. _2 o3 y8 z# i9 @# S
5 R+ e9 p4 U. ^0 gFFmpeg就是开源的。OpenBSD也是开源的。这些项目没人给他们钱做安全审计,但他们的代码,运行在全球几十亿台设备上。8 y; B* \3 A0 s7 s
; B+ N3 \9 s* P- c7 U
还有一个细节,我觉得特别有意思。
) @ Q0 Y: y2 z( ` G! b3 D
- }- d7 h _9 N; Z+ Y' a: \漏洞发现之后,公开披露的时间是90天。. w* O) w# B7 ^% u+ i& Q6 D: r8 ]
, l2 _, C4 k, r5 x
90天是什么概念?
. u8 M4 f4 V7 y: z, f" j/ Q; S; j5 Q( @' f6 s' J
行业标准的漏洞披露窗口是90天。这个时间足够让厂商评估漏洞、制定修复方案、推送更新,但又不至于让漏洞在黑市上流通太久。
, U# L( P. `; V) I s2 t1 M
' }8 [$ A. g/ ]9 p( ~但这里有一个问题:90天是针对"有人发现了漏洞"这个前提来说的。2 L" z6 o- I5 d* z& K
2 F( L5 w8 o. L; u: m
Mythos Preview现在能以前所未有的速度挖出漏洞。它一天挖出来的漏洞,可能比以前整个安全社区一个月挖的还多。
7 @$ Q' f0 H- {+ \ s2 L8 o
3 ^% s1 Z% J: A2 z" N' P. e$ Y这意味着,漏洞披露的节奏,整个就变了。
/ [7 q) k$ f# \5 ?- o$ W0 C4 C3 V: K5 y/ c. r
以前是"挖到一个,披露一个"。现在是"AI在持续不断地挖,每90天披露一批"。
S$ s1 _! \8 \8 \0 s- R# a9 S3 u8 z3 v
厂商的补丁开发速度,能不能跟上AI的发现速度?) I2 i' f5 R# c, C0 b6 V
0 ]" e+ p( a8 W/ }# j
这个,我说实话,不知道。但我觉得,这是整个Glasswing项目最值得观察的地方之一。; p3 Z e4 ~1 G! \! H; H0 U
" t9 S$ E% v; q/ n
写到这儿,我突然想到了一个更大的问题。
6 P, {! _! t9 N2 m1 I" N8 e9 J8 ?! y o% X/ x
Glasswing这个名字,本身就是一只蝴蝶的名字。玻璃翼蝴蝶。它的翅膀是透明的,像玻璃一样。- C7 g8 X7 }' }
1 \4 t; C8 G, p$ z @, E
透明,意味着隐藏的东西变可见了。
7 G0 {. u0 i/ h2 G
/ M L# U8 y3 L3 W6 q一只蝴蝶的翅膀是透明的,它就隐藏不了任何东西了。它在哪里,飞向哪里,所有捕食者都看得清清楚楚。
# W9 `! R" k n( |. i4 J2 @) W$ J2 d. n" Z( c
这个意象,放在漏洞挖掘上,太精准了。; s* r; [% ?# k3 `4 U$ s% Z7 g
! t5 S$ w% t) S3 u代码里那些隐藏了几十年都没人发现的漏洞,在AI的"眼睛"之下,突然就透明了。0 @& E6 v0 T" g/ c. r& o( J
9 ?! d) h+ S) e: {! N以前我们说"security through obscurity"——通过隐藏来保证安全。你的代码不公开,漏洞藏在暗处,攻击者找不到。
/ `) j8 ]$ c n& L1 ?, y3 O1 a2 P: [5 E2 D" K6 S
但现在,只要代码存在,AI就能读。Mythos Preview不需要你的代码是开源的,它只需要能接触到代码——不管是源码、还是编译后的二进制、还是运行时的行为轨迹。
$ k* b( O! o; X. Z. [4 n% }$ P7 D* A* y5 O( u0 N
代码越来越难藏了。或者说,代码里的漏洞越来越难藏了。
) X: x @4 A! y$ }. G' {: Y9 X1 f4 y8 i! z
这是一件好事吗?* U+ }* [3 r( T: O4 P* C
( }/ m6 d! F/ f& @我觉得,短期内,这是一件非常非常好的事。7 i2 z ~3 Z& M/ [
( q0 F" n5 x' _; {1 b4 q全球互联网基础设施里,有多少代码是10年、20年、30年前写的?没人敢审计、没人敢动、出了问题就打补丁接着跑的,有多少?
( n+ D% Y; l, s+ R& H# Z8 u
7 X( D8 `4 r" U1 r* a8 x- I. l这些代码就像一颗颗定时炸弹,埋在整个数字世界的基础里。% u: M/ p5 T1 w4 V+ D; E5 G5 r$ z" f
$ J. h( T4 U7 | ~
AI能做的是,帮我们把这些炸弹找出来,一颗一颗地拆除。/ B. F$ Y" [, B* L$ s4 H9 ]4 g2 p+ o
, F3 U L4 L) ~$ ^
但长期呢?) X9 Q( y' j) K* _) g# J( o
9 y% z" u. l& F( K, j, n当所有可见的漏洞都被AI清除干净之后,剩下的,是什么样的世界?
( c8 _ n; V9 V! B2 p( m
$ }3 S/ ~- j1 H5 e6 e# J9 n" k是代码质量极高、安全性极强的一个世界?还是所有攻击者也在用同样的AI,攻击的速度和防守的速度同步提升的一个世界?
7 a. n( l9 H6 T9 @0 b3 j! v3 V3 M
* T& p' z) w% j+ i) s" U' [% \我也不知道。
( r c- p; @1 J/ o
) K9 m+ x" [ Y' `) m但有一件事我特别想强调。, _# A1 h n& P% G
4 N# `! L" O; b" A: u3 H' L8 X这次Glasswing联盟里,有JPMorganChase,有CrowdStrike,有Palo Alto Networks。这些公司,是真正的安全重度用户。
; Z# g0 G; w8 ^" |' p
$ I( t/ p5 h# d& H: k* H他们自己有能力挖漏洞吗?当然有。JPMorganChase的安全团队在全球排前列。CrowdStrike就是做安全的。) C+ c* O5 F& A
3 y& C8 I2 f( ?- \0 a; _; E1 q
他们为什么还要加入这个联盟,用别人的AI?( l$ Z( t( T; W$ m
?1 a s5 S4 ?8 {" M* y
我大胆猜测一下:因为挖漏洞这件事,规模太大了。
, C* E2 ~% l$ W' L# Y/ k( I* Z k! x5 c4 }3 E$ ^; c
全球代码量太大了。每一家公司,即使安全团队再强,也只能覆盖自己的代码库。但外面的供应链、开源组件、合作伙伴的代码,你根本管不到。+ [; b# w( Y+ v }0 c+ r$ ~
9 k5 a( d+ \! X Q- \
Mythos Preview的价值,不在于它比你的安全团队强。而在于它能同时扫所有地方。: R4 _% d) h* W: i1 S5 G$ _" F
( q$ B. @0 h# o7 K
这是规模效应。
2 d! L" W1 u, M6 Y5 ], L
. k& d8 | D1 t% d. W就像打补丁。手工打补丁,你只能打你知道的那些机器。自动化打补丁,你能打你所有的机器。AI扫漏洞,相当于在每一个代码提交的时候,就自动扫一遍。
& J2 {4 P- J. |% D; Y* [+ R5 W/ Y8 `
这个规模,是人类团队根本无法覆盖的。1 d1 n) N3 o, m3 `% h/ S
2 X9 Q. F1 D. e9 E0 O7 iGlasswing这个项目,还有可能往一个方向发展——成为一个独立的第三方机构。6 t1 i4 I, d0 D" O3 N
) k, \# s& \( Y3 V- B/ N) ]; T! Y$ x什么意思?" z# p% B& ~- Q% d% I7 U- |+ M" X
. Q3 H0 r* l" m
现在它还是Anthropic牵头、11家公司参与的联盟。但未来,它可能变成一个真正独立于任何商业公司的安全机构。它的评估结果,有公信力;它的漏洞报告,有权威性;它给出的安全评级,整个行业认。. i, O- L0 O3 Z. V! F7 N k
; b% @5 r* @8 K& a: x+ }7 ^类似现在的ISO认证,但针对的是代码安全。
& H$ O( C& H- ~/ {& `4 q0 L: F
5 L2 }! g" o* A+ o( d' z# d想想这个画面。未来的软件采购,合同里可能不只要写"符合SOC2",还要写"通过Glasswing认证,漏洞数为0"。
2 _3 B2 `2 ] ~0 a3 {$ t+ N j- p9 K5 [4 V& m
这不是不可能的。1 S% }" }" s' E6 j
9 W7 Y" ?6 s6 \! r/ \( g# D+ p0 D
当然,路还很长。现在还只是第一步。但方向是对的。
8 j$ C: O( S- b! g! w& b4 z }" a5 |, |2 F* Q9 o( G) P; N
好了,写了这么多,让我最后说几句掏心窝的话。
3 ~- R0 I ?* z
8 D: J* v) L4 j, ?6 W6 |) P, \! b我这次看到Glasswing的新闻,第一个反应是兴奋,第二个反应是有点怕。
4 z# y {: |) C+ q( p' @: ^' w0 T3 L2 L
兴奋是因为,我真的觉得,这是AI在安全领域做的最有价值的一件事。以前我们聊AI安全,大家想的都是"AI能不能被攻击"——对抗样本、数据投毒、模型劫持。这些很重要,但离普通开发者很远。( M" {% }, Y T$ h3 N! |- h
/ J0 }4 Y: q2 W这次不一样。这次是AI在帮我们发现自己的脆弱点。5 j) G* ?. W9 y, {7 R. Y
" x0 x+ I& [' K; ]& L
这种脆弱点,我们以前不知道,或者知道但没有能力发现。AI把它们挖出来,摆在阳光下,告诉你这里需要修。
1 S# S8 }; f0 Y, x/ N' x* K1 h3 G8 ]# b# B9 f; p( ~
这是AI在补人类的短板。不是在超越人类,是在帮助人类补上人类自己够不到的地方。
8 A0 X* N, Y" S2 S. |2 e! I! G ~
8 E8 A# N$ k6 E- M. v我怕的是什么呢?
# x( s& e+ a e# Y( d) z C0 O" Y. D+ x1 l$ U/ ]
我怕的是,这个工具,只有大公司用得起。
5 [9 B) C8 S0 R/ D4 L/ b+ L- a; q3 l
. ]' D: {# s% L* G3 DAWS、Google、Microsoft,Bedrock、Vertex AI、Foundry。这些平台,都是商业平台。Cloudflare这种中型公司,可能用起来没问题。但那些真正需要安全检测的——初创公司、开源项目、十几人的小团队——他们能用到吗?
- a7 { v: c! q9 C
2 ~0 {+ q- J3 Q+ p6 r# j( JAnthropic捐的那1亿美元额度够用多久?分到全世界的开源项目上,每个项目能分到多少?
6 C& T) v* O/ A* U$ d: q! T$ I% {- A+ [7 q" r I
这些问题,现在还没有答案。
0 H0 C6 i0 n% P! v4 B0 A% p- m
. I6 K; @) [1 `8 X- ?但有一点我特别想强调。; r8 l6 G; Q: I! g* u
' r+ _/ c, O2 ^7 g
Glasswing这个项目,让安全这件事,第一次真正有了一种"基础设施"的可能性。
" v9 j; A: C1 H$ g
# X' v! q9 N1 l' o% U# \2 m0 [以前的安全,是奢侈品。你要么雇得起安全团队,要么买得起企业级扫描工具,要么你就裸奔。6 U6 Z; }' ^8 ?3 u- U. L
- S1 u; o; `6 d; l* k! K
AI改变了这个等式。Mythos Preview能发现那些企业级工具发现不了的漏洞,但它的调用成本,并没有比那些工具贵多少。
3 _% J% ^3 _, ?1 V l) Y( J `4 O+ h$ q
当漏洞挖掘的成本持续下降,当AI扫描变成每一个代码仓库的标配,我们或许真的会迎来一个更安全的互联网。: D2 @, N. ^% y* J4 s6 x' d4 L
$ B1 j9 U. V1 Z6 q7 p1 W$ j这一天什么时候来?我不知道。可能5年,可能10年。
0 z6 K8 f/ V) C& U1 |; v2 H8 T
# {* w1 R i4 v. u- h7 |, E但Glasswing,让我第一次觉得,这件事不是痴人说梦了。
6 k. T8 K: X+ b0 f |
评分
-
查看全部评分
|