TA的每日心情 | 开心 2020-4-8 10:45 |
|---|
签到天数: 227 天 [LV.7]分神
|
玻璃之翼降临——Glasswing计划与Claude的Mythos Preview) k! C% n) z* k% M
* z: V2 T6 Y6 Q( s2 t5 t. T$ {0 f1 O6 v# b3 F0 W
一个预览版的AI大模型刚刚挖出了一个尘封27年的漏洞,然后11家科技巨头都坐不住了……# \) m# _* e) h$ H8 y, f
. l( `3 F$ i4 V' d
故事是这样的。
* ?/ c' X* G, q4 V5 c5 O) o
7 X n5 P0 j, {. x$ s0 j我今天看到这个新闻,看完之后愣了好几秒。/ o/ ]% z; g5 l" T4 U, u
$ j% ?; O8 C7 y& c
一家叫OpenBSD的公司——做操作系统的,算是安全领域的老前辈——他们有一个漏洞,在代码里躺了整整27年。1998年写进去的,没人发现。
3 T# J. C; \# R; m. j ^/ ^; {) @ \
结果被一个AI模型给挖出来了。: ^8 J; y" o) \" ?+ X8 W
8 Q/ y; \+ c3 G6 C* ~
这肯定不是那种"我们用AI扫了一下代码库发现了问题"的挖出来。而是那种"这个漏洞藏在最核心的地方,所有传统工具都扫过5百万次,一次都没报过警"的条件下挖出来。5 p* g+ G2 s, c, w6 J, p
; L' u% }3 v" m% d% q然后,这个AI模型,顺手还把FFmpeg里一个16年的漏洞也给挖了。
- O, ~* R* [; X: s- j
; ~- _2 O2 |2 x4 C' HFFmpeg,音视频处理领域最最最核心的基础设施。全世界的视频播放器、浏览器、直播平台,有几个不是建立在FFmpeg之上的?这个漏洞在里面藏了16年。5百万次自动化测试,没一次报过警。$ n9 ] s# t8 J$ N# X. Z
! o9 Z, p* N- O然后呢?, ~; G- u% M8 O& E8 f
; m7 q! \+ x, d0 S1 C k# x
然后,11家全球最大的科技公司——Google、Microsoft、Apple、NVIDIA、CrowdStrike、JPMorganChase、Google等等——坐下来,说了一句话:我们一起出钱,让这个AI模型,能被全世界的安全研究员用上。
8 w& f) A# b) N0 @( y6 n# U# F, T) o/ D8 x9 \5 y
这个项目,叫Glasswing。1 |8 K) Z$ K1 |2 P5 v6 w
: ^9 m( ?' w6 ^: j- P3 u
glasswing
. v: w- E7 A5 r, Z
/ _! d! A5 m8 X. k$ f6 ?3 n8 c4 V
# q" _5 T" f6 y* m* V先说清楚Glasswing是什么。
8 } ?* X* m) ~ y6 \ h3 L! b, b9 { a+ n- \
简单说,它是一个AI安全联盟。发起方是Anthropic,加入方是一堆哪怕是不关注技术领域也叫得出名字的科技巨头。它的核心,是一个叫Claude Mythos Preview的模型——注意是Preview(预览版),就是还没正式发布的那个版本——专门训练来挖漏洞的。$ L% E$ J/ B. q g
$ K; T& j( @8 g1 R
有多强呢?
: J( ~$ m0 q6 J5 ]1 G
9 z- }+ J0 {% s0 l* E [6 uCyberGym基准测试,83.1%。作为对比,Claude Opus 4.6,得分是66.6%。不是Claude Opus 4.5,是Claude Opus 4.6,Anthropic目前最强模型。
+ C. o1 g# g/ C) o$ F* o2 P
: i% r3 M! _1 G+ u/ W9 BSWE-bench Verified,93.9%。还是SWE-bench Verified,不是那个容易一点的版本。Claude Opus 4.6是80.8%。6 ~+ U( F/ S4 E3 h# ^
( u D, q9 i5 a1 H, s差了13个百分点。7 M% y J. \7 ^! w
6 c$ _! U/ X: w6 J' E, v
你说这13个百分点意味着什么?4 ?( f# Y2 a% x. ]/ y; x/ n
) U* r; _' `6 Z# z
意味着,传统扫描工具漏掉的那些最刁钻的漏洞——那些藏在层层调用关系里、藏在异常分支里、藏在并发边界条件里的漏洞——Mythos Preview能找到。
* \1 K1 f% R, G5 _' c$ z
- O# a- i! p. H( h& t意味着,27年的OpenBSD,16年的FFmpeg,以后可能不会再有了。
0 A2 ~' s; g) I# I0 i- W' @' ^, u2 B K8 q# y# h9 J
或者说,这种级别的漏洞发现速度,会比以前快几个数量级。
8 n) b4 L* K L( y1 L) D) S3 a* }: T8 c
% s+ {$ C, `, ~- `: h说到这个OpenBSD的漏洞,我必须展开讲一下,因为这个例子太有意思了。
$ H3 U! d, D# l8 N/ ]. S+ a) N6 T3 }2 u; M" }: [
OpenBSD是个什么存在?
5 @' T, \& E6 U! V- Z6 u2 V$ T7 m) l# l. ~! c! `
它是BSD操作系统的一个分支,最核心的设计哲学就是安全。代码审计之严格,在整个开源社区都是有名的。很多安全研究员的信仰级操作系统。4 ~; s- W! B- N7 T U. \
0 @8 g7 K) y# c& u这样的项目,代码审计了多少年了?二十多年。* ?' l1 T8 n; x# D: F
2 ?8 `- |/ c4 ?7 b然后,一个漏洞,在里面躺了27年。2 m+ p( |4 M# `: u- x, I; X
. O# E9 V; i. }& f/ _0 z! m4 b0 s# k这说明什么?. b4 b. W" P/ O, l4 @ ~
, K5 H, A# I( Q
不是OpenBSD的人不行,是传统的审计方式有盲区。任何人工审计,只要时间足够长、人足够累、代码足够复杂,就一定会有漏洞漏过去。这是人性的边界,不是能力的边界。& Q0 ^5 p% X, C* r8 Z
% A. V. W( K& n% b
但AI不一样。AI不会累。AI不会因为审了三个月之后注意力下降。AI可以在几个小时之内,把整个代码库的所有调用路径、所有边界条件全部穷举一遍。1 `7 ~) M5 _2 E: s3 v! W
" a, {+ M8 c( rMythos Preview发现的那个OpenBSD漏洞,是一个本地权限提升漏洞。攻击者如果已经拿到了一点点访问权限,可以利用这个漏洞进一步提升到root权限。
1 c! |2 R% }4 i0 }
, \# I4 Q* G( ~. p1 l这种漏洞可怕在哪?
* G3 p2 O; P0 D5 C7 l2 O
" x, \/ A( j7 j) Q" F9 x它不显眼。它不是那种"输入框里填个单引号就弹shell"的漏洞。它需要你对系统有相当深的理解,才能构造出触发条件。
! W) J3 Y5 j0 ?) e2 k$ H* [7 i" n! A/ x; _5 o0 U, R: d% X, E1 e' B
传统扫描工具扫不出来,是因为它的payload模式不在规则库里。AI不一样,AI学的是语义理解,它不是匹配特征,它是理解代码在"想什么"。
6 `( Q6 e6 Y- e- ]- U1 c5 x( [( @' `
FFmpeg那个例子更让我震撼。- z9 F6 x8 R$ V
+ K _8 ?/ j' p% ?& g* `& ?8 m
16年。7 U7 D8 Z1 G7 C. [" ~" D i' D
! b) i9 Z, d9 H( M$ U7 VFFmpeg上一次发现这种级别的漏洞是什么时候?2009年。
/ I4 ~$ T; A2 o( w9 [0 o. _# M; x/ d- H
16年都没有人发现。然后Mythos Preview扫了一下,找到了。
- d9 T* V0 X3 c% Y' @* v4 t+ B
0 g/ O v5 H( {6 Z& k; m注意这个"扫了一下"的背景。SWE-bench测试集里,有大量是真实世界里的bug修复历史。FFmpeg这个bug在历史上真实存在过,是某次修复的时候被记录下来的。这意味着,Mythos Preview不仅能做代码审计,它能做的是:从海量代码里,识别出"这个写法有问题,即使目前还没有人报告过"。
t L5 d' `& m( h1 \- [7 @+ l* c8 [: _: E. s
这是主动防御,不是被动响应。/ T& O6 @8 k- A9 A/ m& H
- @7 t8 W$ L( g1 @传统安全的方式是:出了事 → 分析样本 → 提取特征 → 更新规则库 → 下次能识别。/ f5 l& _# z3 q x
" N) Y! s, F) y0 ?
AI安全的方式是:不需要样本。直接读代码,告诉你这里有个洞。
- ]$ H3 x% x5 o9 B6 b9 |# C- t4 y0 P* e) Y
这两者之间的差距,大概就是"等贼来了再装防盗门"和"在盖楼的时候看着图纸就告诉你这堵墙扛不住地震"的差距。
8 Q& \9 n# P% i& d' S. b% ^4 I/ d/ c, l" s3 C/ k
现在说说大家最关心的问题:谁能用到,怎么用,花多少钱。3 W8 s b# X N% v5 G$ G: `4 {8 z% P
. b+ k y4 i4 t4 d: l G, H
Glasswing的AI能力,现在跑在三个平台上:Amazon Bedrock、Google Vertex AI、Microsoft Foundry。
* [% D1 S# C) c K
0 [- z; F3 o% l: f% R这三个平台,恰好是AWS、Google Cloud、Azure。全球三大云服务商。
) K/ ^; Z' @ Q/ m2 ~
3 }" M+ P4 T1 U( R2 w你在任何一个上面,都能调用Mythos Preview的漏洞检测能力。$ _# w7 x6 B7 G
1 G0 o: U5 w$ N8 {4 K
价格呢?过了初始的credits之后,每百万token输入25美元,每百万token输出125美元。
/ M/ d E4 M! s
9 C- Z/ y" T# ^2 Q8 D( s: q这个价格贵不贵?
1 y2 S* R. f. |8 j, i& E/ \( R/ [ x+ S' c+ i* e3 k* |
对比一下就知道了。现在市面上做代码安全扫描的工具,像Snyk、Veracode这一类,商业扫描工具的报价大概是每个开发者每个月几十到几百美元不等。而且它们扫的是规则匹配,不是语义理解。
& q" z8 X G) A3 t) P8 F x& \6 J- l- M
Mythos Preview能发现那些工具发现不了的漏洞。& L& F0 I* d; f6 ~
2 v: S9 ^7 J% i
这不是贵不贵的问题了,这是"有没有意识到你以前省的那些钱其实在交更多的学费"的问题。
- U4 B' y+ {9 `4 f1 ?/ n" B8 j5 i3 M$ N; z" U
另外,Anthropic自己掏了1个亿美元的使用额度,分给联盟成员和开源社区。还额外捐了400万,250万给Alpha-Omega/OpenSSF,150万给Apache软件基金会。
% r: V9 l: X1 {7 V) E5 D" W
' g3 k E7 j% |# w' @& Z% S" w6 s这些钱是用来干什么的?让那些没有商业利益驱动的开源项目,也能用上最好的漏洞检测能力。) I- H9 |# t' D, X: o/ x
# o: L$ \% F0 q6 z2 U; R6 mFFmpeg就是开源的。OpenBSD也是开源的。这些项目没人给他们钱做安全审计,但他们的代码,运行在全球几十亿台设备上。
% ^- Q6 O7 n2 p& v+ a" t5 e6 s$ @+ F* c# y
还有一个细节,我觉得特别有意思。
2 }8 Z. ?# [( Z! H8 U% c7 y( y& `& w' s1 h4 a
漏洞发现之后,公开披露的时间是90天。2 W3 B* Y/ e3 R& U4 p3 e8 m
+ m% M' ~! n2 p8 b/ c' U+ i90天是什么概念?) p5 U! ~# D' k# O* B
8 K, n! C6 }1 ?1 f! R行业标准的漏洞披露窗口是90天。这个时间足够让厂商评估漏洞、制定修复方案、推送更新,但又不至于让漏洞在黑市上流通太久。8 o4 ]% A3 M# G/ v* y; o
( W! Q& M/ a0 D3 [
但这里有一个问题:90天是针对"有人发现了漏洞"这个前提来说的。. m; A+ _, @% j/ F5 X
3 T/ \4 P$ S) N* k4 ~ PMythos Preview现在能以前所未有的速度挖出漏洞。它一天挖出来的漏洞,可能比以前整个安全社区一个月挖的还多。* Q: g! l, Q9 F
7 [; Q7 _8 C* P# o" z( l) M9 i# q* Z
这意味着,漏洞披露的节奏,整个就变了。' Q* b; G1 H. N/ S
- \$ J/ ]1 l2 p: H
以前是"挖到一个,披露一个"。现在是"AI在持续不断地挖,每90天披露一批"。
, e! F+ B/ z3 _
2 A, O# E! \) J! U厂商的补丁开发速度,能不能跟上AI的发现速度?* n! y; n9 b J9 q& \& x
5 X' R6 |% Y% P4 j
这个,我说实话,不知道。但我觉得,这是整个Glasswing项目最值得观察的地方之一。) U9 Z j3 E' [
+ l4 C& I6 } I! z7 r/ h7 ]
写到这儿,我突然想到了一个更大的问题。
" V3 ~. w$ k+ y: f. X
# w L* T: P) V) l/ G4 L U$ G2 wGlasswing这个名字,本身就是一只蝴蝶的名字。玻璃翼蝴蝶。它的翅膀是透明的,像玻璃一样。% U4 T, t5 O5 j2 `( J; o' ]. ~+ X) {6 X
* x( I, H6 z; i透明,意味着隐藏的东西变可见了。
" A/ q% ] L, c$ z4 _" A% T$ I) ^
7 Y9 A+ R8 D( h, N3 o5 K一只蝴蝶的翅膀是透明的,它就隐藏不了任何东西了。它在哪里,飞向哪里,所有捕食者都看得清清楚楚。2 C a+ u4 T) y1 `* {- E0 _( q
7 k8 |" d) a5 U8 f9 E这个意象,放在漏洞挖掘上,太精准了。
& O2 y9 |6 m8 z) c$ m/ e
: E9 q6 ]8 W5 T9 _2 S/ i3 y9 K& _代码里那些隐藏了几十年都没人发现的漏洞,在AI的"眼睛"之下,突然就透明了。
9 _" V% q- {: N/ H- {, g6 H$ |" H/ m1 J. |5 c" k
以前我们说"security through obscurity"——通过隐藏来保证安全。你的代码不公开,漏洞藏在暗处,攻击者找不到。
5 g- r/ F# {& K* O( U: w/ F n2 t# j" g$ y5 G: R2 e7 O
但现在,只要代码存在,AI就能读。Mythos Preview不需要你的代码是开源的,它只需要能接触到代码——不管是源码、还是编译后的二进制、还是运行时的行为轨迹。+ N$ q& I7 P+ n. X3 ]
9 L2 S b9 M% x% H0 L# ~
代码越来越难藏了。或者说,代码里的漏洞越来越难藏了。" [3 c* P) W3 Q( m- j
5 Q! I+ x8 X" d
这是一件好事吗?
8 Q2 `2 t1 X' c- ]2 i! l; ?/ m' R. [& I( b5 j5 ^3 t. h% R2 w x
我觉得,短期内,这是一件非常非常好的事。- P/ G% d' J3 V! k
; s7 d# ^0 H p3 E( |3 b' g/ C全球互联网基础设施里,有多少代码是10年、20年、30年前写的?没人敢审计、没人敢动、出了问题就打补丁接着跑的,有多少?8 m# O2 O. U! r) X3 a
, c' s6 N \( P2 J7 O& t( o
这些代码就像一颗颗定时炸弹,埋在整个数字世界的基础里。# z' n5 G3 Q: r: b9 i$ q6 t; V7 c
) s- k! d6 p( y% z. XAI能做的是,帮我们把这些炸弹找出来,一颗一颗地拆除。2 f% g: i' s; H, R$ ^4 ^
/ r$ f& v0 J8 Y' c1 E但长期呢?
9 }' b+ [6 V2 O/ N% D' b0 Z3 s! P
- L3 G- J5 _: H, q7 }当所有可见的漏洞都被AI清除干净之后,剩下的,是什么样的世界?8 l2 x" M" o+ {
7 O" _2 V4 y6 R$ O- W4 h3 _是代码质量极高、安全性极强的一个世界?还是所有攻击者也在用同样的AI,攻击的速度和防守的速度同步提升的一个世界?! x# e+ b/ s8 k- y* v* r/ v m
) B/ x1 |8 j- O7 ?* `; Z* b! e
我也不知道。
/ V f0 r$ v7 h9 ]8 Y6 L# x5 n, T( @4 g! B
但有一件事我特别想强调。8 U- |* X& {/ X/ L, O. h% v% @
) w: k7 N# R% y) L# j2 K这次Glasswing联盟里,有JPMorganChase,有CrowdStrike,有Palo Alto Networks。这些公司,是真正的安全重度用户。
' P5 i4 ?9 ?- W- c9 I& z$ r
8 P* g' y3 E2 ~' v2 Y( A他们自己有能力挖漏洞吗?当然有。JPMorganChase的安全团队在全球排前列。CrowdStrike就是做安全的。
3 s* h( f! `9 T o( }( N4 E0 `# }/ G4 p, }( h, L
他们为什么还要加入这个联盟,用别人的AI?
% R: @$ g: A5 y. z
- [3 h: ~& b$ C K我大胆猜测一下:因为挖漏洞这件事,规模太大了。0 q9 j8 |* A4 X; d0 v% z S
( {5 S, x: D2 Z3 Z
全球代码量太大了。每一家公司,即使安全团队再强,也只能覆盖自己的代码库。但外面的供应链、开源组件、合作伙伴的代码,你根本管不到。# A0 J4 b; G% v! G% z
- F) N: R% c# C4 o6 u. ^
Mythos Preview的价值,不在于它比你的安全团队强。而在于它能同时扫所有地方。
+ }; U k; \: H' [9 u. k7 ~3 k: V, s! q- P7 w; D
这是规模效应。
* N/ G2 m3 K3 T+ C9 r# Y+ p/ D. g8 L
就像打补丁。手工打补丁,你只能打你知道的那些机器。自动化打补丁,你能打你所有的机器。AI扫漏洞,相当于在每一个代码提交的时候,就自动扫一遍。
% `% C2 q* v5 Y) w3 `7 ~8 V8 L9 e. w4 {4 A/ O+ O
这个规模,是人类团队根本无法覆盖的。
5 n) H" E" p7 O- \1 u* z$ y5 A/ n- d2 N7 B; b& i6 l7 w$ L
Glasswing这个项目,还有可能往一个方向发展——成为一个独立的第三方机构。% D6 Z( j# I/ o; m. O
5 w8 d; C5 _# Z$ {% }+ G: H1 N什么意思?' K) E4 o3 r7 H* n6 C o# n
6 H& A5 h) Z6 J( K
现在它还是Anthropic牵头、11家公司参与的联盟。但未来,它可能变成一个真正独立于任何商业公司的安全机构。它的评估结果,有公信力;它的漏洞报告,有权威性;它给出的安全评级,整个行业认。! l* X3 r7 R! {6 d" Z5 `- I% q9 c
# O; h" I, B# E, m类似现在的ISO认证,但针对的是代码安全。
8 s+ s& E& W% ~3 i# s9 a$ H8 \+ r1 o/ m
想想这个画面。未来的软件采购,合同里可能不只要写"符合SOC2",还要写"通过Glasswing认证,漏洞数为0"。$ ^: |) @1 C) A( [
; Q7 O# {# C: Z/ d7 J$ V
这不是不可能的。
# s$ A# z; K- {" Q# H# K
" ~% ], _3 N0 |8 a2 G O) y) P& G当然,路还很长。现在还只是第一步。但方向是对的。
" Q+ C! N$ F8 W- P- ^
" h% f: e# U0 p/ G好了,写了这么多,让我最后说几句掏心窝的话。
% ~( B3 T3 ? f- N5 `9 y
6 ^+ v3 }! W/ Y& R) ?" x7 v; z我这次看到Glasswing的新闻,第一个反应是兴奋,第二个反应是有点怕。) N& r# h& x ?& n8 k+ O" J
6 s" G' g" d; B6 j" y6 Y
兴奋是因为,我真的觉得,这是AI在安全领域做的最有价值的一件事。以前我们聊AI安全,大家想的都是"AI能不能被攻击"——对抗样本、数据投毒、模型劫持。这些很重要,但离普通开发者很远。! ^& I7 O; g: N4 _8 q
9 h5 o8 s7 x* l% u1 I9 [( s这次不一样。这次是AI在帮我们发现自己的脆弱点。
3 Z! k. h& m# y" }. d, E
: Z$ e) Q; ^" Q这种脆弱点,我们以前不知道,或者知道但没有能力发现。AI把它们挖出来,摆在阳光下,告诉你这里需要修。) o- W! D+ i9 n+ f( P
|: v, P1 O- _! ]0 H
这是AI在补人类的短板。不是在超越人类,是在帮助人类补上人类自己够不到的地方。; B' r# T1 q$ U# A8 X5 E5 N
/ I w1 a* n9 Q9 k2 L我怕的是什么呢?
' D0 n: S/ `! ~! Y" [+ `
9 j; H* F, n2 f* y+ G1 G$ E我怕的是,这个工具,只有大公司用得起。1 T, t4 ^7 r# H. C+ m
- A9 [ H/ T5 G1 ]1 e9 c3 \; @( sAWS、Google、Microsoft,Bedrock、Vertex AI、Foundry。这些平台,都是商业平台。Cloudflare这种中型公司,可能用起来没问题。但那些真正需要安全检测的——初创公司、开源项目、十几人的小团队——他们能用到吗?
% |, ?. B0 |- q' Q2 R+ o. f
) V& L* L$ d# J- wAnthropic捐的那1亿美元额度够用多久?分到全世界的开源项目上,每个项目能分到多少?
; X! _5 M' B* P5 s* D2 ^7 s2 ^8 Y! ^: K! |' d
这些问题,现在还没有答案。
3 d7 o" d$ u5 v; m$ p' I5 [5 i3 R) b0 T" f% m+ E
但有一点我特别想强调。" r/ d& _# `: P6 ?6 N* @, k9 F
6 L2 I) B5 N6 R4 S1 }, r8 h, q
Glasswing这个项目,让安全这件事,第一次真正有了一种"基础设施"的可能性。
% \3 ] l3 N( s1 [: D/ _
) s$ R) l& s2 J4 e7 t+ `# E以前的安全,是奢侈品。你要么雇得起安全团队,要么买得起企业级扫描工具,要么你就裸奔。
; a {- m; L; D, o' ^
! l( C: k+ w: AAI改变了这个等式。Mythos Preview能发现那些企业级工具发现不了的漏洞,但它的调用成本,并没有比那些工具贵多少。- }% b9 i1 V! j& [' T
, r* F9 B$ t1 u" N7 j) j4 `
当漏洞挖掘的成本持续下降,当AI扫描变成每一个代码仓库的标配,我们或许真的会迎来一个更安全的互联网。
7 }: ]* E7 {4 [
! ]" W6 X% n# x% _8 A这一天什么时候来?我不知道。可能5年,可能10年。/ J) f3 E' c2 _: |
8 y5 q. _ G# D8 r5 g, V# d但Glasswing,让我第一次觉得,这件事不是痴人说梦了。9 M5 z5 c/ D1 q
|
评分
-
查看全部评分
|