TA的每日心情 | 开心 2020-4-8 10:45 |
|---|
签到天数: 227 天 [LV.7]分神
|
玻璃之翼降临——Glasswing计划与Claude的Mythos Preview
# O _9 a3 A" j! U( ]1 C) i& z) p' ~6 O# W1 t) ?- n# Y7 J
" A4 R! q# j9 H' f- o
一个预览版的AI大模型刚刚挖出了一个尘封27年的漏洞,然后11家科技巨头都坐不住了…… E! a5 H# T% ]& E- l1 q; w+ {" a
7 H1 i4 O( [4 ]) ?3 j- d故事是这样的。1 m7 P7 H7 J5 h( t' p
: i2 w1 K, X$ z我今天看到这个新闻,看完之后愣了好几秒。
+ @' W" q, f$ }% B) B& B) }% z# E0 D% ~8 X
一家叫OpenBSD的公司——做操作系统的,算是安全领域的老前辈——他们有一个漏洞,在代码里躺了整整27年。1998年写进去的,没人发现。
" w! p) X4 V( D9 p2 R7 Y& m0 p6 y/ O: y4 t" G$ [
结果被一个AI模型给挖出来了。
& {' |$ b( u- @6 e+ @
5 S/ ~* M1 P+ z( P4 M" e' Y& c* ?4 w这肯定不是那种"我们用AI扫了一下代码库发现了问题"的挖出来。而是那种"这个漏洞藏在最核心的地方,所有传统工具都扫过5百万次,一次都没报过警"的条件下挖出来。
4 I2 S2 I( E: B" C' O( x5 h3 Y0 t! e9 O( E+ M- ^2 \6 [4 i$ F
然后,这个AI模型,顺手还把FFmpeg里一个16年的漏洞也给挖了。. ~" f7 W! i G6 U" o" s& ?: ]
2 J* I3 k0 Z( [; oFFmpeg,音视频处理领域最最最核心的基础设施。全世界的视频播放器、浏览器、直播平台,有几个不是建立在FFmpeg之上的?这个漏洞在里面藏了16年。5百万次自动化测试,没一次报过警。: |3 M: D# l( w) U! i' B
4 g7 ] ^2 ?: [- M V7 q$ {! j+ ]然后呢?
: V( g8 J- w% S2 T: t' L! ?1 r* M2 a6 \* M6 x. i6 z
然后,11家全球最大的科技公司——Google、Microsoft、Apple、NVIDIA、CrowdStrike、JPMorganChase、Google等等——坐下来,说了一句话:我们一起出钱,让这个AI模型,能被全世界的安全研究员用上。
. a' Q/ f6 h$ \- z& Q* w# d0 `0 P1 |, r5 T* H4 t
这个项目,叫Glasswing。; T7 _4 V9 x- _* W
9 V$ }& W# j+ F5 z: S M+ c
glasswing
0 p- h; O q0 \! u& {9 K4 I: d) U7 _/ D3 B; Z" x
: j9 w" w- q" t" Q0 ]& ~9 Q+ ^9 l
先说清楚Glasswing是什么。6 H2 e: p7 U) z6 w1 k/ f# } b
* n' F0 c' i1 H# d
简单说,它是一个AI安全联盟。发起方是Anthropic,加入方是一堆哪怕是不关注技术领域也叫得出名字的科技巨头。它的核心,是一个叫Claude Mythos Preview的模型——注意是Preview(预览版),就是还没正式发布的那个版本——专门训练来挖漏洞的。+ j6 g& g1 h3 N# R8 M
: @ V# j. B5 r0 B* H. M4 h
有多强呢?& H4 A: K+ \, R @
2 B. }# o, o- ]+ m2 a
CyberGym基准测试,83.1%。作为对比,Claude Opus 4.6,得分是66.6%。不是Claude Opus 4.5,是Claude Opus 4.6,Anthropic目前最强模型。) Q. p. G) `3 t. g) ]% C
! g! D- A0 q% f, `, U8 X
SWE-bench Verified,93.9%。还是SWE-bench Verified,不是那个容易一点的版本。Claude Opus 4.6是80.8%。, S1 A/ t+ c8 K3 d% H, o# {# _, l7 A. }9 L
7 { `$ D, ~+ r% U: d9 A9 J# G( }差了13个百分点。
5 D" J2 o7 Y3 M' D2 n2 g
* D( o: v& ]# I- t& @你说这13个百分点意味着什么?
( }! K4 H, N5 Y8 x' ~
( ]/ l) f' H4 O+ e' r m意味着,传统扫描工具漏掉的那些最刁钻的漏洞——那些藏在层层调用关系里、藏在异常分支里、藏在并发边界条件里的漏洞——Mythos Preview能找到。
1 F/ y/ u0 F& U: x) L( Z& |& m3 l0 b5 G. M8 T/ \4 I
意味着,27年的OpenBSD,16年的FFmpeg,以后可能不会再有了。
/ L4 p' R* J' @; W- l0 B$ M2 O$ I! R `# p1 N
或者说,这种级别的漏洞发现速度,会比以前快几个数量级。
& S" a. q% E5 M, L" J
2 c0 O. S2 M8 k) ?4 y- w1 i: Z说到这个OpenBSD的漏洞,我必须展开讲一下,因为这个例子太有意思了。
) n% [$ [* P- A7 b5 y( b; m3 [0 p0 c* L5 W+ }
OpenBSD是个什么存在?' c, e; P% J( @! Z% V9 f3 o
' n; g2 b: A) P+ i它是BSD操作系统的一个分支,最核心的设计哲学就是安全。代码审计之严格,在整个开源社区都是有名的。很多安全研究员的信仰级操作系统。0 C( {3 w% j& w8 w. K# z$ }' a
, s: |% A* {9 w0 p7 l
这样的项目,代码审计了多少年了?二十多年。( b9 F6 c. C+ P8 z$ J
5 d- v. k3 |2 o5 t( m8 ~ ^, S
然后,一个漏洞,在里面躺了27年。8 g! b& J0 Y( h# D' }3 G! D/ h. s6 e) K
3 E9 U4 N# ^) b/ l' p; T3 w/ Z$ [这说明什么?" h$ Y. @/ s6 ~: m
& ]& B& v! `1 P: Q( M+ ^不是OpenBSD的人不行,是传统的审计方式有盲区。任何人工审计,只要时间足够长、人足够累、代码足够复杂,就一定会有漏洞漏过去。这是人性的边界,不是能力的边界。
+ i( }6 \. L( ^3 u4 j! l" R5 a$ M: U- J4 a) ^/ |+ H
但AI不一样。AI不会累。AI不会因为审了三个月之后注意力下降。AI可以在几个小时之内,把整个代码库的所有调用路径、所有边界条件全部穷举一遍。
5 A. B' j% ]: j8 r/ Y( d
' u+ W6 E9 b ?- c: j" LMythos Preview发现的那个OpenBSD漏洞,是一个本地权限提升漏洞。攻击者如果已经拿到了一点点访问权限,可以利用这个漏洞进一步提升到root权限。
- E3 h& w6 q' l1 O- A0 Q% f/ T
2 e" k1 {% { }# u这种漏洞可怕在哪?
& J- \4 y2 m w- @( L
+ I3 k* A! f: U% G9 u它不显眼。它不是那种"输入框里填个单引号就弹shell"的漏洞。它需要你对系统有相当深的理解,才能构造出触发条件。
/ U! ?$ A% f- C
, h) d0 h4 L6 ]# w) M8 e k' I传统扫描工具扫不出来,是因为它的payload模式不在规则库里。AI不一样,AI学的是语义理解,它不是匹配特征,它是理解代码在"想什么"。9 }, s+ P5 Y1 ?) S4 Y) R& {
9 h$ g7 i; `, C+ I9 c# B# d5 JFFmpeg那个例子更让我震撼。6 Z$ u1 M a7 R; H# G, [
8 m8 W; ^! N' R( \
16年。
( Q9 z% G. U$ O, e' y3 c H( Z* _
$ M( Z! w% a. E. K7 v: Z/ W/ aFFmpeg上一次发现这种级别的漏洞是什么时候?2009年。8 E5 U+ e# z/ T! G1 s
) h5 n6 {( u$ t# C8 X; Y
16年都没有人发现。然后Mythos Preview扫了一下,找到了。
8 q y: D* g0 D+ t7 A ^+ X: r+ Q% f @2 P( X1 x3 {
注意这个"扫了一下"的背景。SWE-bench测试集里,有大量是真实世界里的bug修复历史。FFmpeg这个bug在历史上真实存在过,是某次修复的时候被记录下来的。这意味着,Mythos Preview不仅能做代码审计,它能做的是:从海量代码里,识别出"这个写法有问题,即使目前还没有人报告过"。
J+ }: j1 R4 m& E J. j& Y8 |' C
; {. V6 Q# M6 g! W( k这是主动防御,不是被动响应。/ A' Y6 ~" b( e1 B; w' z" L9 t# ^
! B4 F! h0 l4 k- Q8 q传统安全的方式是:出了事 → 分析样本 → 提取特征 → 更新规则库 → 下次能识别。
# G& _/ A7 F/ V" X6 g$ G
# ]0 M3 p& N- x! ~+ D8 ]AI安全的方式是:不需要样本。直接读代码,告诉你这里有个洞。
- O3 d: c9 {6 j. ?9 N2 L: m- M4 I( e0 R/ ~
这两者之间的差距,大概就是"等贼来了再装防盗门"和"在盖楼的时候看着图纸就告诉你这堵墙扛不住地震"的差距。9 y/ b6 P9 n, i" }, l# E
, T4 T0 i$ V0 n0 U" o$ |- L) L
现在说说大家最关心的问题:谁能用到,怎么用,花多少钱。
; s; Q* r: e& I6 Z V3 Q, k% A4 O6 I- [
Glasswing的AI能力,现在跑在三个平台上:Amazon Bedrock、Google Vertex AI、Microsoft Foundry。
" M# d! v1 ]# q9 r
1 c) z1 ]' n* h, H* `这三个平台,恰好是AWS、Google Cloud、Azure。全球三大云服务商。
! H4 V7 f( @3 @" `0 ^+ s, U- I3 Y: l9 Q+ a& R; `" ^, Q% m4 v' e
你在任何一个上面,都能调用Mythos Preview的漏洞检测能力。! O& K) j( m- n+ n" y/ r9 v
) V* a# [/ z% E' R
价格呢?过了初始的credits之后,每百万token输入25美元,每百万token输出125美元。
: M5 o* D2 W P8 [) C$ V
& W- i) g% T0 J* k$ g这个价格贵不贵?
9 D+ e0 O# I+ B7 |3 z/ H0 B M8 q: @: m* @+ W* C
对比一下就知道了。现在市面上做代码安全扫描的工具,像Snyk、Veracode这一类,商业扫描工具的报价大概是每个开发者每个月几十到几百美元不等。而且它们扫的是规则匹配,不是语义理解。
% b* @8 [5 T, }) h0 w$ d# ^- E* ?# W( L' B$ W# b
Mythos Preview能发现那些工具发现不了的漏洞。
/ _8 m9 h' k' w7 f% F$ W
2 p$ O) y$ s6 Y) n/ X这不是贵不贵的问题了,这是"有没有意识到你以前省的那些钱其实在交更多的学费"的问题。
5 q4 n, o4 \7 {8 {* [
" K$ S5 d0 Y, H; P! A" i另外,Anthropic自己掏了1个亿美元的使用额度,分给联盟成员和开源社区。还额外捐了400万,250万给Alpha-Omega/OpenSSF,150万给Apache软件基金会。
- t6 Y' U" Y* E8 ?( N
6 j6 X! a* u! Y) l+ f0 E3 d这些钱是用来干什么的?让那些没有商业利益驱动的开源项目,也能用上最好的漏洞检测能力。5 u2 t# ^) S7 X+ @4 U4 y4 Z1 y
) M) B4 F% Z1 r" B7 `
FFmpeg就是开源的。OpenBSD也是开源的。这些项目没人给他们钱做安全审计,但他们的代码,运行在全球几十亿台设备上。! b- c B4 l1 G) @0 y
5 u e' {$ |+ Q" M/ B还有一个细节,我觉得特别有意思。
9 |+ |2 W1 S+ q$ p$ A4 M( f/ Y; W! a1 ?2 |" U
漏洞发现之后,公开披露的时间是90天。- u r+ y" f+ j" a
: L }+ w' _1 `+ x
90天是什么概念?
1 F" t& \5 N- ]4 D
4 e# @- s8 s& s8 N a& N. }- s行业标准的漏洞披露窗口是90天。这个时间足够让厂商评估漏洞、制定修复方案、推送更新,但又不至于让漏洞在黑市上流通太久。
& L: Q/ F) W$ e- u, @
1 C# y/ L! s! ^. ^. a. {7 ~但这里有一个问题:90天是针对"有人发现了漏洞"这个前提来说的。- c; K, T8 [ R: Y& Q \
u' L. \4 g5 P! S3 R0 B- T
Mythos Preview现在能以前所未有的速度挖出漏洞。它一天挖出来的漏洞,可能比以前整个安全社区一个月挖的还多。
& m2 V% Y6 M4 K. P2 P8 E1 S- g6 {' R
7 A( ` a* E+ e" l这意味着,漏洞披露的节奏,整个就变了。
u( d3 Q3 i w$ A. Y8 L6 X. T& l4 D" V$ F- y U4 A6 C
以前是"挖到一个,披露一个"。现在是"AI在持续不断地挖,每90天披露一批"。
% S' n/ A* W) z% a5 H9 J2 z$ d! R- {, ~2 [9 Y
厂商的补丁开发速度,能不能跟上AI的发现速度?: k1 b3 ~5 l# l" j$ n. ~
; P9 Z! \/ A A6 l1 f
这个,我说实话,不知道。但我觉得,这是整个Glasswing项目最值得观察的地方之一。
( r2 W. ]* T/ j0 m% r( X6 i) f; U5 F
! v) L1 _ ?8 x) V* y写到这儿,我突然想到了一个更大的问题。
5 c O$ i$ b6 w: a- s, {- Y2 X3 \' _6 x9 X$ [
Glasswing这个名字,本身就是一只蝴蝶的名字。玻璃翼蝴蝶。它的翅膀是透明的,像玻璃一样。
5 {: u* z/ |1 V# ^& V& S* F1 k" n U/ q; z4 C% v
透明,意味着隐藏的东西变可见了。
# A9 J. I3 P2 w( u- d% m% V
6 v/ l) Q) X; @! F- _* n一只蝴蝶的翅膀是透明的,它就隐藏不了任何东西了。它在哪里,飞向哪里,所有捕食者都看得清清楚楚。. M- H9 y( @6 y$ h
, B( V7 Z, l1 s7 M D) X
这个意象,放在漏洞挖掘上,太精准了。
6 ^+ u! k! t" L1 h, t) _% R# F3 M! j" p, r5 [
代码里那些隐藏了几十年都没人发现的漏洞,在AI的"眼睛"之下,突然就透明了。) ~! H: v; k# D, {3 G- `, ~+ f4 R
( W& E1 v& t) _- L9 Y以前我们说"security through obscurity"——通过隐藏来保证安全。你的代码不公开,漏洞藏在暗处,攻击者找不到。
, M6 x( `0 `- ^2 N7 `" j7 l* d9 o" U3 W+ N( m1 a1 A9 ~
但现在,只要代码存在,AI就能读。Mythos Preview不需要你的代码是开源的,它只需要能接触到代码——不管是源码、还是编译后的二进制、还是运行时的行为轨迹。
/ {' T9 R+ f9 E/ Y
* g. I# K* E) f! j' p代码越来越难藏了。或者说,代码里的漏洞越来越难藏了。7 U3 l) r' Z2 b; c# X; n- r
- C8 b' Q/ C: s5 g& {' }. k
这是一件好事吗?) P! p. X9 r8 n3 N+ _
+ n1 R" o7 |6 x1 b我觉得,短期内,这是一件非常非常好的事。* g7 p) P! @7 Q9 ^5 V
) N- w# ]( L9 o# ]% p
全球互联网基础设施里,有多少代码是10年、20年、30年前写的?没人敢审计、没人敢动、出了问题就打补丁接着跑的,有多少?# M! @1 }" j) p9 h! }- z% I
7 T; E! m6 U' p t" z* n
这些代码就像一颗颗定时炸弹,埋在整个数字世界的基础里。3 ^: S+ _2 G% x5 V( v
$ c% _; N3 Y" z
AI能做的是,帮我们把这些炸弹找出来,一颗一颗地拆除。
( N. s2 @! D4 B( ~) K7 _3 w0 `: y) H7 D9 h c% ^; Q2 V
但长期呢?
; H$ j8 q k- s6 Z8 e, R, V% f( J+ ?3 n1 C2 o; N2 f* ]
当所有可见的漏洞都被AI清除干净之后,剩下的,是什么样的世界?6 k+ U: o9 {1 l1 a; O6 G+ q4 Q
+ t+ j" z9 W* ]; @& q5 r. z& u
是代码质量极高、安全性极强的一个世界?还是所有攻击者也在用同样的AI,攻击的速度和防守的速度同步提升的一个世界?
. T* w7 _* S M( s! ^ p6 n0 X, e. K0 ^% R' o
我也不知道。2 T6 S8 s I" V+ h
; ^. ~ E! x" @# T但有一件事我特别想强调。. p$ Z( v- E) O' `( l6 J& N: A+ m
- C a9 c& o" L [0 B3 H, p
这次Glasswing联盟里,有JPMorganChase,有CrowdStrike,有Palo Alto Networks。这些公司,是真正的安全重度用户。+ j% l" t Q" }
+ G# I( @9 `6 a1 `6 H2 ?, }他们自己有能力挖漏洞吗?当然有。JPMorganChase的安全团队在全球排前列。CrowdStrike就是做安全的。7 W8 B3 T7 q: |7 U# ~. Y r' f; s$ ~8 @
% W* `4 t, p7 P& j0 J
他们为什么还要加入这个联盟,用别人的AI?
1 v. q% j/ o% E/ J1 P; @7 n' |1 U0 W, P9 ?
我大胆猜测一下:因为挖漏洞这件事,规模太大了。
4 j, ?4 F1 \; B8 o/ p3 X5 Q. J2 B, H. F" [, b q6 q# D
全球代码量太大了。每一家公司,即使安全团队再强,也只能覆盖自己的代码库。但外面的供应链、开源组件、合作伙伴的代码,你根本管不到。5 R( K q7 m& o k9 Y! h) r8 C- h- K/ ~
. r" y2 @. V6 R& {& F0 q1 n P
Mythos Preview的价值,不在于它比你的安全团队强。而在于它能同时扫所有地方。
3 b, L6 d/ H. {, B: q" E+ \% D/ O; v+ V( M& V$ k, b; D- T/ V
这是规模效应。+ ?$ v& T& t1 D6 d' g
- L( G9 k; F( b ?, _/ g. E$ a
就像打补丁。手工打补丁,你只能打你知道的那些机器。自动化打补丁,你能打你所有的机器。AI扫漏洞,相当于在每一个代码提交的时候,就自动扫一遍。8 a \! M1 s5 x" ~1 Y' R8 Z
p |! \2 V8 o% N$ N$ b" V这个规模,是人类团队根本无法覆盖的。
! V9 f: t# x3 { v" \
4 e. i t/ \! W4 t7 `* C4 r' ^' R' e' ^Glasswing这个项目,还有可能往一个方向发展——成为一个独立的第三方机构。
+ c' A) v7 j* j/ p3 I- }2 b: r* @6 }8 V0 S' @8 M! X
什么意思?. v& u* Q7 Z) ?' J' E
& C; g5 I4 z1 P6 }' {- i现在它还是Anthropic牵头、11家公司参与的联盟。但未来,它可能变成一个真正独立于任何商业公司的安全机构。它的评估结果,有公信力;它的漏洞报告,有权威性;它给出的安全评级,整个行业认。$ u# m. R# G/ M* e
2 u. X* `0 Q& S- a1 ]
类似现在的ISO认证,但针对的是代码安全。6 G g/ L4 `4 ^ F6 N* ]/ B
9 ^, {* @: a n) s% q想想这个画面。未来的软件采购,合同里可能不只要写"符合SOC2",还要写"通过Glasswing认证,漏洞数为0"。( {/ j8 ~9 q% _ w2 f$ w8 d- i
( F, {$ v. x3 q% l9 J这不是不可能的。: D# c! _* n% G8 l) B
5 U0 p4 F* P, \9 b r* N) w$ z1 B9 W
当然,路还很长。现在还只是第一步。但方向是对的。5 p& }# w V9 p* P
1 u: R2 n2 U6 q+ {* ?3 P: i好了,写了这么多,让我最后说几句掏心窝的话。7 N& s) v3 H; z2 `1 T
, w# y3 j7 R. I7 t, ?4 a
我这次看到Glasswing的新闻,第一个反应是兴奋,第二个反应是有点怕。
/ s; f# j, n2 N
k" r _, `" f兴奋是因为,我真的觉得,这是AI在安全领域做的最有价值的一件事。以前我们聊AI安全,大家想的都是"AI能不能被攻击"——对抗样本、数据投毒、模型劫持。这些很重要,但离普通开发者很远。3 m, r: k2 m P) X7 G9 l
z' a4 q$ M+ E) D5 `( v" T$ }3 Z) W这次不一样。这次是AI在帮我们发现自己的脆弱点。3 F/ F. G; M- e) d3 Y+ _: A1 h, H4 x
- W# p9 V0 W3 _$ Z) p这种脆弱点,我们以前不知道,或者知道但没有能力发现。AI把它们挖出来,摆在阳光下,告诉你这里需要修。9 F' P: h+ H( G/ v# q/ n4 ?7 T
! w; C, S) R4 M- H2 I! ]* ? E
这是AI在补人类的短板。不是在超越人类,是在帮助人类补上人类自己够不到的地方。
' R5 m0 P* t H2 f5 R$ U# v
9 k$ U8 v& {" J- R我怕的是什么呢?
2 J* ]+ ~8 N- c2 @* {
2 h7 P- D8 Z% V! ` U我怕的是,这个工具,只有大公司用得起。0 a; F3 R1 B; T/ l/ F
y9 x# w; N! v* L: MAWS、Google、Microsoft,Bedrock、Vertex AI、Foundry。这些平台,都是商业平台。Cloudflare这种中型公司,可能用起来没问题。但那些真正需要安全检测的——初创公司、开源项目、十几人的小团队——他们能用到吗?- b' Z% Y) I. M) Z) l3 P0 J
1 i& v3 T2 u* V, `% v
Anthropic捐的那1亿美元额度够用多久?分到全世界的开源项目上,每个项目能分到多少?
( D) c. |# o6 f/ X' F8 @% f9 g9 Q6 `+ p9 L$ J0 Y) H; O$ G- l4 \, `" s
这些问题,现在还没有答案。5 u, T- C6 }% k+ q" K2 \/ }
& L3 H" I4 j( [% x. a. J但有一点我特别想强调。) w1 C0 L( f0 M- V
, g) Q& k0 F9 F& U
Glasswing这个项目,让安全这件事,第一次真正有了一种"基础设施"的可能性。0 l( s& o. S6 [, X+ U1 g X2 t4 ]
% q: A9 ^) z, E/ |: Z% N7 i1 Z X以前的安全,是奢侈品。你要么雇得起安全团队,要么买得起企业级扫描工具,要么你就裸奔。 t+ G6 _) K- ^" I+ K2 G
I/ s5 |6 n, g3 Y& x2 @7 rAI改变了这个等式。Mythos Preview能发现那些企业级工具发现不了的漏洞,但它的调用成本,并没有比那些工具贵多少。
1 ^0 v0 k7 ^) v- p8 d9 F! F/ Q9 |4 N2 L" [$ w3 E0 B
当漏洞挖掘的成本持续下降,当AI扫描变成每一个代码仓库的标配,我们或许真的会迎来一个更安全的互联网。, c6 d- j. x9 p5 x# E% ?
5 V) B* [- b. M6 }这一天什么时候来?我不知道。可能5年,可能10年。/ ^' c" f1 n- Y# w4 y
9 t; }: m9 j \; R% G) v
但Glasswing,让我第一次觉得,这件事不是痴人说梦了。- x) ]+ H; q3 p" j
|
评分
-
查看全部评分
|