TA的每日心情 | 开心 2020-4-8 10:45 |
|---|
签到天数: 227 天 [LV.7]分神
|
玻璃之翼降临——Glasswing计划与Claude的Mythos Preview" W/ |! ~0 f& z" _, C0 L: ]: r$ a
$ \2 M# X" I& F0 i
' _% Z0 \; ?8 B/ z
一个预览版的AI大模型刚刚挖出了一个尘封27年的漏洞,然后11家科技巨头都坐不住了……
u: W; Y( m8 O. ^. y& S
! [0 A* u/ a5 A1 { }; q7 S' a故事是这样的。$ M2 y5 _$ m) t3 e
/ Y; m& b w3 |( i; N/ x
我今天看到这个新闻,看完之后愣了好几秒。
1 r8 C. A# P& z# b3 D
! k; M2 b4 S8 x9 ] N- Q' I" t一家叫OpenBSD的公司——做操作系统的,算是安全领域的老前辈——他们有一个漏洞,在代码里躺了整整27年。1998年写进去的,没人发现。. T( [& J, [, L$ e
+ s* u! Z) Y# T+ m- A# Z/ F
结果被一个AI模型给挖出来了。( \& {( q+ A# N6 _
) A4 L7 x3 O1 |0 n- A5 I* b! o( ?这肯定不是那种"我们用AI扫了一下代码库发现了问题"的挖出来。而是那种"这个漏洞藏在最核心的地方,所有传统工具都扫过5百万次,一次都没报过警"的条件下挖出来。7 ?3 m5 m$ I. d* o& P. d% ]; k
1 |) X+ y9 N y9 s" M! j
然后,这个AI模型,顺手还把FFmpeg里一个16年的漏洞也给挖了。
% C6 A7 u9 Y$ e$ g9 N* a( o/ q* G( h% T
FFmpeg,音视频处理领域最最最核心的基础设施。全世界的视频播放器、浏览器、直播平台,有几个不是建立在FFmpeg之上的?这个漏洞在里面藏了16年。5百万次自动化测试,没一次报过警。
7 W9 R/ ~( c$ d& t0 P7 Y' I( ^" L; ~0 e1 P6 B R
然后呢?
, t4 ^' }5 z: s2 e+ g `
* q& { X4 z6 [2 w% K. D9 U; o然后,11家全球最大的科技公司——Google、Microsoft、Apple、NVIDIA、CrowdStrike、JPMorganChase、Google等等——坐下来,说了一句话:我们一起出钱,让这个AI模型,能被全世界的安全研究员用上。4 n% p2 v3 f# m- u9 W# g
, T7 N2 I5 U+ ?: C
这个项目,叫Glasswing。/ Z) ~4 E% k( ?
0 ]$ y4 D( U; P. n; d4 X" p! z, s" h! [
glasswing
3 j3 A7 x! t' Q8 f: T W# w% ?/ ]) o7 J# z" | o2 S" R/ ~; F
, Z8 U3 H3 Q! s* Q; y2 u, |; t
先说清楚Glasswing是什么。
1 ?! S! i, j' _. j+ B: C
% a4 f3 W7 h0 y6 u# P简单说,它是一个AI安全联盟。发起方是Anthropic,加入方是一堆哪怕是不关注技术领域也叫得出名字的科技巨头。它的核心,是一个叫Claude Mythos Preview的模型——注意是Preview(预览版),就是还没正式发布的那个版本——专门训练来挖漏洞的。; F( A& {, ~- `$ C* K, z& W
4 P2 f* x8 A- n( I$ c5 q
有多强呢?
# d) Y4 f$ j# |+ j5 c
- ^5 y1 O8 S( YCyberGym基准测试,83.1%。作为对比,Claude Opus 4.6,得分是66.6%。不是Claude Opus 4.5,是Claude Opus 4.6,Anthropic目前最强模型。
4 B ~; @& g3 [1 `! q4 ~
. N1 v, P) }% @( J( R' T' E! dSWE-bench Verified,93.9%。还是SWE-bench Verified,不是那个容易一点的版本。Claude Opus 4.6是80.8%。" y# |, x, q. x7 i
* Z p/ Q: f- u% E差了13个百分点。
6 j0 H7 x# H# H+ K7 W+ Y2 u1 C
9 A& n: b% E( l9 ~) Z你说这13个百分点意味着什么?
+ Q& J Z$ u" B% e. z: ?5 r i; j! X$ W3 V" d# D5 J- ^, P' U
意味着,传统扫描工具漏掉的那些最刁钻的漏洞——那些藏在层层调用关系里、藏在异常分支里、藏在并发边界条件里的漏洞——Mythos Preview能找到。: B# D% |, u& J }) n5 H
2 p, ~& I% ]9 E6 `意味着,27年的OpenBSD,16年的FFmpeg,以后可能不会再有了。$ z& J5 U; h- p5 Z3 k4 B, f! K
2 k6 \) d2 c& X' b
或者说,这种级别的漏洞发现速度,会比以前快几个数量级。
# w. o, |+ \4 x
3 \/ G3 [8 E6 d) ]6 p说到这个OpenBSD的漏洞,我必须展开讲一下,因为这个例子太有意思了。* U3 F# ^& ^4 B3 r. F1 l
/ z3 `% N7 t+ `- D
OpenBSD是个什么存在?
4 P! E" i$ @ i0 ^
3 z& A6 C" E/ p0 ?它是BSD操作系统的一个分支,最核心的设计哲学就是安全。代码审计之严格,在整个开源社区都是有名的。很多安全研究员的信仰级操作系统。
. `$ d- ~4 m# Z5 v4 v+ @ G2 R4 r+ p0 R2 d. ~. d- Q
这样的项目,代码审计了多少年了?二十多年。
' I, P, A# o# m% R0 T% R
$ N" J+ z# ~, _( G4 o; Z7 a/ F然后,一个漏洞,在里面躺了27年。
- K0 N1 Q- ]2 v! ~8 T
d# Q! \: {9 B! ~这说明什么?& D/ I/ d: m" X# c! ]3 \
$ K( ]$ Q. j- f. e V; C2 Z& Q不是OpenBSD的人不行,是传统的审计方式有盲区。任何人工审计,只要时间足够长、人足够累、代码足够复杂,就一定会有漏洞漏过去。这是人性的边界,不是能力的边界。
M! h& L: {5 f) s% f) c& R8 g
' ]: @) u2 M D; h8 n3 z5 S+ X但AI不一样。AI不会累。AI不会因为审了三个月之后注意力下降。AI可以在几个小时之内,把整个代码库的所有调用路径、所有边界条件全部穷举一遍。
l* m1 N% I* t* V* Q5 H9 }; m. A0 v" I- p
Mythos Preview发现的那个OpenBSD漏洞,是一个本地权限提升漏洞。攻击者如果已经拿到了一点点访问权限,可以利用这个漏洞进一步提升到root权限。" `' \, R3 m7 V9 p- z4 Q
" s3 F% T7 z- c) o, I9 a这种漏洞可怕在哪?
! F& J- Y' a5 j3 ]! p- F- i$ x4 P+ d
它不显眼。它不是那种"输入框里填个单引号就弹shell"的漏洞。它需要你对系统有相当深的理解,才能构造出触发条件。7 g7 ?2 Z# _& y8 J# K2 A
Q& g, ~' x5 u- o# w
传统扫描工具扫不出来,是因为它的payload模式不在规则库里。AI不一样,AI学的是语义理解,它不是匹配特征,它是理解代码在"想什么"。
* J1 F7 b- R, F, `% U) G% @' `+ M5 D! V; k( L
FFmpeg那个例子更让我震撼。
; j. h6 \& F% ]! b! r1 m
- G+ d" ]) \ I. X) Y16年。8 j3 d/ F3 @/ u9 A* U3 F/ d* }
$ h) z3 S# C7 r- K( m B+ b: W" `FFmpeg上一次发现这种级别的漏洞是什么时候?2009年。
9 P, A" Y' K- Q! {( } ~' k0 \! ^/ T4 m9 j `# ^6 h
16年都没有人发现。然后Mythos Preview扫了一下,找到了。
|' F6 y( l p- z2 l' H/ x* ^1 L5 s5 } r+ o8 Q; {2 A6 r
注意这个"扫了一下"的背景。SWE-bench测试集里,有大量是真实世界里的bug修复历史。FFmpeg这个bug在历史上真实存在过,是某次修复的时候被记录下来的。这意味着,Mythos Preview不仅能做代码审计,它能做的是:从海量代码里,识别出"这个写法有问题,即使目前还没有人报告过"。
6 q% [: `; t( d( p& h
) p! N/ d+ z3 Y; r: M这是主动防御,不是被动响应。
& f* n9 R) x$ e% R8 d* S/ P+ [
C9 o) f# e! y$ H4 Y& I传统安全的方式是:出了事 → 分析样本 → 提取特征 → 更新规则库 → 下次能识别。
, G# I5 ~, y/ m s* X' p" c; h, E! y |2 k7 L) m B4 Y) W
AI安全的方式是:不需要样本。直接读代码,告诉你这里有个洞。0 B. v: l, V3 B3 ^# N Y
; a" M% ]) p4 M% y% d8 w这两者之间的差距,大概就是"等贼来了再装防盗门"和"在盖楼的时候看着图纸就告诉你这堵墙扛不住地震"的差距。9 x* |: S7 a* N6 E+ z
& l2 ?0 j6 u8 x) ^* @3 G( k现在说说大家最关心的问题:谁能用到,怎么用,花多少钱。* _9 V. r, c& \" B. @1 x- @3 f- _
$ K n8 n# s, u: e& c
Glasswing的AI能力,现在跑在三个平台上:Amazon Bedrock、Google Vertex AI、Microsoft Foundry。
! U; j# S0 I8 c6 i& ~5 D; u1 ^" X. L! u! i1 k+ I8 P( J
这三个平台,恰好是AWS、Google Cloud、Azure。全球三大云服务商。; G& J# v3 v& H
/ V5 Q' X2 e H$ @) w( u4 k+ j" I你在任何一个上面,都能调用Mythos Preview的漏洞检测能力。
, ^" x" N. Z$ L4 F9 d; x5 u. R& R) b5 _1 m
价格呢?过了初始的credits之后,每百万token输入25美元,每百万token输出125美元。6 `! `4 @( r# U7 i# A5 @. i$ l
6 K5 `- X" e( Q' m8 ?. W这个价格贵不贵?1 `9 _) c. o# x+ V# \ l# v
^! {4 A( \8 F" K对比一下就知道了。现在市面上做代码安全扫描的工具,像Snyk、Veracode这一类,商业扫描工具的报价大概是每个开发者每个月几十到几百美元不等。而且它们扫的是规则匹配,不是语义理解。) w% X2 t5 F- n' f* n7 Z
B" z1 b: p7 ?Mythos Preview能发现那些工具发现不了的漏洞。
6 J( d! V+ J* l2 T
" L: s& n, t' R* l9 a; u这不是贵不贵的问题了,这是"有没有意识到你以前省的那些钱其实在交更多的学费"的问题。
# k- X) x4 O1 s$ C6 G0 c" }. c6 G, u# r' y
另外,Anthropic自己掏了1个亿美元的使用额度,分给联盟成员和开源社区。还额外捐了400万,250万给Alpha-Omega/OpenSSF,150万给Apache软件基金会。) ~& A. U" ?' }" }. o
8 j& l4 g0 w9 a. ]6 J9 b
这些钱是用来干什么的?让那些没有商业利益驱动的开源项目,也能用上最好的漏洞检测能力。; W5 {: Z- B+ m
% K/ l1 v. L! ?+ L4 N# JFFmpeg就是开源的。OpenBSD也是开源的。这些项目没人给他们钱做安全审计,但他们的代码,运行在全球几十亿台设备上。. A4 Q4 p( v( D4 c3 w1 j& o. {+ w
4 c l& d+ ^; O4 P8 t
还有一个细节,我觉得特别有意思。
M- p4 A" d) @# S: ~
% @, i- f# C, r2 D* B漏洞发现之后,公开披露的时间是90天。( [- e9 v- D, M7 i) J
% f$ Y, y% y' `7 ~4 l! h
90天是什么概念?
' w( B4 w3 K: [2 G7 ]& t4 ?# Y, T' c: J( x( E) S
行业标准的漏洞披露窗口是90天。这个时间足够让厂商评估漏洞、制定修复方案、推送更新,但又不至于让漏洞在黑市上流通太久。. Y0 t, o" O, m5 r
3 r0 |) z& F) \9 H; N0 r5 y但这里有一个问题:90天是针对"有人发现了漏洞"这个前提来说的。
' k9 Y+ \- W' w) P e" K* o# c5 i# k8 V% v- Y7 k- M! \# z! x
Mythos Preview现在能以前所未有的速度挖出漏洞。它一天挖出来的漏洞,可能比以前整个安全社区一个月挖的还多。/ x$ a$ _" `) ] a/ q4 F
- e6 [6 }- k; N2 `5 Q$ E
这意味着,漏洞披露的节奏,整个就变了。
5 ^$ V* J0 p5 ]+ l9 ^. B/ P* w" y4 Z( ^6 U0 o/ q
以前是"挖到一个,披露一个"。现在是"AI在持续不断地挖,每90天披露一批"。
. R* @, A7 B( _% i; B- D3 [) @' |7 W+ q# t e- Q0 w6 o
厂商的补丁开发速度,能不能跟上AI的发现速度?
# z( Q% A, |: q( G1 f% z
* g( ]% B- v% X5 s4 k# t这个,我说实话,不知道。但我觉得,这是整个Glasswing项目最值得观察的地方之一。
6 ]1 Z7 `" z8 i3 j; j( S4 A8 O9 L$ |+ s: K" J
写到这儿,我突然想到了一个更大的问题。
+ ?' I3 ]4 |. l/ S$ x* b" d' l# u& |. i1 g0 l g
Glasswing这个名字,本身就是一只蝴蝶的名字。玻璃翼蝴蝶。它的翅膀是透明的,像玻璃一样。
1 I3 L& t, y6 f/ I! K8 S) e+ I; q2 b) V5 C8 r3 m
透明,意味着隐藏的东西变可见了。
H5 b" l+ S3 b" I- m. j: E$ ? `; ?% h/ a# Y4 Q* V: B; ]
一只蝴蝶的翅膀是透明的,它就隐藏不了任何东西了。它在哪里,飞向哪里,所有捕食者都看得清清楚楚。, Z) M. `, j3 d* Z8 \3 ?
6 C; y; Z6 z3 X# b2 j
这个意象,放在漏洞挖掘上,太精准了。. P M$ a, [" a0 l8 ?6 S+ I
& D1 n O4 Z) N) c' x. k
代码里那些隐藏了几十年都没人发现的漏洞,在AI的"眼睛"之下,突然就透明了。+ D5 t+ w3 b& X- N/ \
+ Z! g1 u% c& _8 P3 }
以前我们说"security through obscurity"——通过隐藏来保证安全。你的代码不公开,漏洞藏在暗处,攻击者找不到。+ m# d0 l' G' b2 u& Z( l- ^
! F6 g0 ` e. z; A8 \) j9 B0 N% {
但现在,只要代码存在,AI就能读。Mythos Preview不需要你的代码是开源的,它只需要能接触到代码——不管是源码、还是编译后的二进制、还是运行时的行为轨迹。
& y; }; `( ?$ t: F- ^- P- W m( ~' z# }
代码越来越难藏了。或者说,代码里的漏洞越来越难藏了。
% b4 h3 V/ i( q" E4 I7 S2 |: ?, N: w1 f, H: m, h
这是一件好事吗?3 x" w6 R. f: o7 T9 N1 R/ M
. T N8 k1 |3 A) F$ \ ?
我觉得,短期内,这是一件非常非常好的事。7 j& X# c& c( r) r5 v
5 @) ]2 k: f5 d) E8 N" i6 n" |全球互联网基础设施里,有多少代码是10年、20年、30年前写的?没人敢审计、没人敢动、出了问题就打补丁接着跑的,有多少?
0 b1 p" `& U7 z- A5 }: q7 K5 c( }4 b' `, K
这些代码就像一颗颗定时炸弹,埋在整个数字世界的基础里。' e+ k" e( s6 o0 [) Z
# g! j6 m" j- x) H6 ^% ^3 [. rAI能做的是,帮我们把这些炸弹找出来,一颗一颗地拆除。
) W. ^: A* j7 C3 `
+ |( f E9 c* g但长期呢?
& H/ w4 M! x) }7 c% |* m# ~
$ J6 g3 c6 y* [; i9 b: A当所有可见的漏洞都被AI清除干净之后,剩下的,是什么样的世界?
/ D( m% g# c+ J( H, G8 N- _3 m! ~$ N
是代码质量极高、安全性极强的一个世界?还是所有攻击者也在用同样的AI,攻击的速度和防守的速度同步提升的一个世界?. K/ S) C5 r, W- @% l$ ]% o
0 [2 {3 J) v5 [) Y; t
我也不知道。) V3 V$ c" t! r3 j' U3 g
7 n3 x8 P6 {1 s% R6 f% M3 {1 [
但有一件事我特别想强调。
$ p! Z, @% j2 K# B% o3 D
M4 ?( U" g4 {6 V* X' s这次Glasswing联盟里,有JPMorganChase,有CrowdStrike,有Palo Alto Networks。这些公司,是真正的安全重度用户。- ]3 n2 R1 k* D4 {* D9 y% O5 Y
; y0 M" D$ [( W6 k) a- o6 U# G
他们自己有能力挖漏洞吗?当然有。JPMorganChase的安全团队在全球排前列。CrowdStrike就是做安全的。 _1 |0 [; D" v; M
1 F: V4 \% c5 i) J) y他们为什么还要加入这个联盟,用别人的AI?
& ], J3 s. M i# q( v8 F
& t& \$ K8 Z4 g$ V我大胆猜测一下:因为挖漏洞这件事,规模太大了。" i8 ]" Q3 h, w
; p8 o+ f& d* ^7 @. s, D3 I8 X全球代码量太大了。每一家公司,即使安全团队再强,也只能覆盖自己的代码库。但外面的供应链、开源组件、合作伙伴的代码,你根本管不到。
& \7 T+ P6 G/ c) n# o- [' |! a* T& C8 l1 ]/ Y
Mythos Preview的价值,不在于它比你的安全团队强。而在于它能同时扫所有地方。, n& @: \1 ? f5 d% ?8 k
% q% F9 p. g3 R这是规模效应。. ~1 Z+ B+ o8 d% ~
0 ?' w c# E8 F. v8 _0 z就像打补丁。手工打补丁,你只能打你知道的那些机器。自动化打补丁,你能打你所有的机器。AI扫漏洞,相当于在每一个代码提交的时候,就自动扫一遍。
5 j# X+ p& n, Y8 j. @: W: @( c1 L ^0 g- g& i% y
这个规模,是人类团队根本无法覆盖的。
x/ N; k R2 _* Y8 w
1 u/ _7 E6 T& o' z* P' YGlasswing这个项目,还有可能往一个方向发展——成为一个独立的第三方机构。
1 y9 L- Y0 o$ B7 ~$ p
6 k8 A% n0 A" T- V5 n; l5 q什么意思?9 q6 Z; u6 a P
& D- D, @, e, `: J1 m4 e现在它还是Anthropic牵头、11家公司参与的联盟。但未来,它可能变成一个真正独立于任何商业公司的安全机构。它的评估结果,有公信力;它的漏洞报告,有权威性;它给出的安全评级,整个行业认。
) G* ~1 T: ?' {) {9 \1 r
2 \* f- M$ d# ^1 o# y类似现在的ISO认证,但针对的是代码安全。. [+ E, O9 g1 m" I$ Z* u- e
8 g0 }/ n; L! f3 H想想这个画面。未来的软件采购,合同里可能不只要写"符合SOC2",还要写"通过Glasswing认证,漏洞数为0"。3 c: r7 ~5 M# w& C; l
5 u. S1 S5 c& ?这不是不可能的。* Z. k2 ^/ b4 f( q; {( W( l
( Z2 T+ }7 G/ m; {6 m* T( T Q当然,路还很长。现在还只是第一步。但方向是对的。
' j1 A( S/ ], t- r
3 _+ T$ ]% U% c* P" U% r3 D好了,写了这么多,让我最后说几句掏心窝的话。) a0 i* p N `5 S
; p. T; l6 \5 T% q/ C& i我这次看到Glasswing的新闻,第一个反应是兴奋,第二个反应是有点怕。( ]" t6 p e# }' U- ?
5 z1 }# N3 p& A, \
兴奋是因为,我真的觉得,这是AI在安全领域做的最有价值的一件事。以前我们聊AI安全,大家想的都是"AI能不能被攻击"——对抗样本、数据投毒、模型劫持。这些很重要,但离普通开发者很远。
5 N9 g: l c% `! X* U& c
) w$ C8 E q+ V这次不一样。这次是AI在帮我们发现自己的脆弱点。
9 o- Y% C) t& @$ x T: z/ v3 `' f2 w& M* t8 c% `8 X5 r; z
这种脆弱点,我们以前不知道,或者知道但没有能力发现。AI把它们挖出来,摆在阳光下,告诉你这里需要修。! ^- W5 `, O |& d7 S
" @5 q3 P4 Q/ M( h, [这是AI在补人类的短板。不是在超越人类,是在帮助人类补上人类自己够不到的地方。
% P6 f- R# x% Z$ b6 z# E
) X. ]; s) c9 q, i# w7 y我怕的是什么呢?$ T+ u4 v8 v3 d9 R
8 m% u( ^7 n2 ^0 E1 \( ^3 ~5 n9 @: |我怕的是,这个工具,只有大公司用得起。
2 T$ c" o: d8 j6 Q ^4 {: N5 \) O# R9 l3 o" p
AWS、Google、Microsoft,Bedrock、Vertex AI、Foundry。这些平台,都是商业平台。Cloudflare这种中型公司,可能用起来没问题。但那些真正需要安全检测的——初创公司、开源项目、十几人的小团队——他们能用到吗?
1 ~+ t/ t1 c% ~. b; P7 g
) _9 ^+ e. a1 z/ y0 A! i! yAnthropic捐的那1亿美元额度够用多久?分到全世界的开源项目上,每个项目能分到多少?7 U4 Z+ x5 Z6 r* D% v4 [
. r8 ?9 a. O9 {
这些问题,现在还没有答案。) h( Y1 {5 W6 U$ L) K
1 u5 ?* A' q+ l1 x- e但有一点我特别想强调。1 W/ K& Z+ b8 ?
; J: _, D: [0 N! O2 v
Glasswing这个项目,让安全这件事,第一次真正有了一种"基础设施"的可能性。# [1 T! E! l5 L) ?" [! V
* Y* P1 M) U6 `% H, j以前的安全,是奢侈品。你要么雇得起安全团队,要么买得起企业级扫描工具,要么你就裸奔。
+ L! P. m4 _6 j! j
& Q; e: a2 o) t6 B' LAI改变了这个等式。Mythos Preview能发现那些企业级工具发现不了的漏洞,但它的调用成本,并没有比那些工具贵多少。6 P0 w- J3 R/ } l l1 w* u
' h8 l P8 _4 w4 @
当漏洞挖掘的成本持续下降,当AI扫描变成每一个代码仓库的标配,我们或许真的会迎来一个更安全的互联网。
. k- y0 J7 }" K7 b- [/ K9 _
' k, F% o G7 f这一天什么时候来?我不知道。可能5年,可能10年。3 O5 H) M2 e, y4 A" B
8 P5 ]$ v2 i7 C5 U. r8 C1 c! f
但Glasswing,让我第一次觉得,这件事不是痴人说梦了。
& {3 \ h; G W! P2 E& g1 i! p |
评分
-
查看全部评分
|