TA的每日心情 | 开心 2020-4-8 10:45 |
|---|
签到天数: 227 天 [LV.7]分神
|
玻璃之翼降临——Glasswing计划与Claude的Mythos Preview
; ~' {( `& u$ I: S6 B6 B: c# s, i. r; k+ m4 R4 P- g6 A
6 N9 R+ z5 c* y7 M
一个预览版的AI大模型刚刚挖出了一个尘封27年的漏洞,然后11家科技巨头都坐不住了……
% ^# X! f4 ]! ~$ q! r) J
Z. n5 q: {. m, H故事是这样的。
5 d3 X0 ?0 A6 B, H) ?
7 d$ r; P8 _1 p* F' K( N我今天看到这个新闻,看完之后愣了好几秒。5 h( [5 a) a4 ?: g. N
7 d* F4 N3 `- d
一家叫OpenBSD的公司——做操作系统的,算是安全领域的老前辈——他们有一个漏洞,在代码里躺了整整27年。1998年写进去的,没人发现。3 S; V E+ g v. O# ~
7 C# p0 P. j9 d5 I% x5 e结果被一个AI模型给挖出来了。% b9 Q% Q( `+ \% ~
d) [; P& x n: x+ M9 N; q* _, ?0 U
这肯定不是那种"我们用AI扫了一下代码库发现了问题"的挖出来。而是那种"这个漏洞藏在最核心的地方,所有传统工具都扫过5百万次,一次都没报过警"的条件下挖出来。
7 m& h- a2 r2 \4 O7 \2 R% @; D8 q/ b) `
然后,这个AI模型,顺手还把FFmpeg里一个16年的漏洞也给挖了。
; F; y) ]% [" C7 B! k3 c9 e
2 C2 H$ l1 b- W# x+ ~2 AFFmpeg,音视频处理领域最最最核心的基础设施。全世界的视频播放器、浏览器、直播平台,有几个不是建立在FFmpeg之上的?这个漏洞在里面藏了16年。5百万次自动化测试,没一次报过警。' M& ^/ \9 b# I& K& C& ]
$ V* }* b% G3 @$ u: ]9 I: Z然后呢?
* x, b \; X9 s" c; p, ^% H
' m4 m2 w" Z% W9 u9 m& f然后,11家全球最大的科技公司——Google、Microsoft、Apple、NVIDIA、CrowdStrike、JPMorganChase、Google等等——坐下来,说了一句话:我们一起出钱,让这个AI模型,能被全世界的安全研究员用上。. M6 V' V) `+ |3 g6 r, Z
" c/ q% \) r" F6 T
这个项目,叫Glasswing。/ v4 m2 i. W2 L$ x
) t4 L5 H% R2 B7 z
glasswing
. X( ^' r# P7 `7 i* d+ ^; e3 J$ a" l9 j4 K x
& D( f2 e" \! w1 i, q
先说清楚Glasswing是什么。1 n% S; W: P4 E, w. }6 q
3 R' c5 h5 h4 M简单说,它是一个AI安全联盟。发起方是Anthropic,加入方是一堆哪怕是不关注技术领域也叫得出名字的科技巨头。它的核心,是一个叫Claude Mythos Preview的模型——注意是Preview(预览版),就是还没正式发布的那个版本——专门训练来挖漏洞的。
% p% w9 L# w9 V2 O$ y4 y. P! x4 Z( p# g
有多强呢?
2 n( T( n; n( J+ {$ O% v( l) x9 X, Q4 `: y- ~$ X0 H
CyberGym基准测试,83.1%。作为对比,Claude Opus 4.6,得分是66.6%。不是Claude Opus 4.5,是Claude Opus 4.6,Anthropic目前最强模型。
* D1 V8 n: r* Y3 ]( W7 R
" d- {; v, R$ f8 M+ L( D1 bSWE-bench Verified,93.9%。还是SWE-bench Verified,不是那个容易一点的版本。Claude Opus 4.6是80.8%。
2 [* W. V" `, \& z5 I
% [9 R" R3 [$ F/ h差了13个百分点。
2 x7 o; w2 x& L8 @. m
. B3 ?# M' t5 `- Q' V你说这13个百分点意味着什么?
8 l: }# `0 i; ]& O- h6 }6 n9 l9 ?! t6 u$ V' V
意味着,传统扫描工具漏掉的那些最刁钻的漏洞——那些藏在层层调用关系里、藏在异常分支里、藏在并发边界条件里的漏洞——Mythos Preview能找到。
3 b+ g5 f: x5 ~$ F n3 Q5 q3 q/ j6 J) H8 @& o. ]! t* S+ W
意味着,27年的OpenBSD,16年的FFmpeg,以后可能不会再有了。
7 ^" I" u3 r1 x3 o7 B) F* I' e
8 c8 ]/ \" _# v* K或者说,这种级别的漏洞发现速度,会比以前快几个数量级。$ G- C" f" x) p7 e
1 i4 t) E2 g) C) N8 S8 A' [0 S5 G说到这个OpenBSD的漏洞,我必须展开讲一下,因为这个例子太有意思了。& T8 m; F7 O- y; b, f1 @
2 J: z. \! \% d+ |* e
OpenBSD是个什么存在?
! M# w0 H# ?% V& O; s. h
. Z6 o$ H: x/ b3 i3 n% p它是BSD操作系统的一个分支,最核心的设计哲学就是安全。代码审计之严格,在整个开源社区都是有名的。很多安全研究员的信仰级操作系统。; z/ K0 L. l. r5 ?* w5 Y
' O# [5 Z7 c; Q0 k, ]' b, A这样的项目,代码审计了多少年了?二十多年。7 r( _+ K( ~- r/ b! t% Y7 e- e
l: f* T0 f) M' A8 h# W& Q
然后,一个漏洞,在里面躺了27年。
4 J$ l4 U8 m7 V* T i ?) r2 h1 i! l2 a) c5 M' `
这说明什么?
: q ]4 r- a R( Q, D O5 U: M
3 V+ s# H' B" ?* o7 n7 d. m1 n k- L不是OpenBSD的人不行,是传统的审计方式有盲区。任何人工审计,只要时间足够长、人足够累、代码足够复杂,就一定会有漏洞漏过去。这是人性的边界,不是能力的边界。9 T6 M: R! P) @; Z2 {9 G1 O
+ G$ d& H N4 e5 Q+ v
但AI不一样。AI不会累。AI不会因为审了三个月之后注意力下降。AI可以在几个小时之内,把整个代码库的所有调用路径、所有边界条件全部穷举一遍。
! g0 b! H. U& j! s; a
! u0 w* r5 u; h( [Mythos Preview发现的那个OpenBSD漏洞,是一个本地权限提升漏洞。攻击者如果已经拿到了一点点访问权限,可以利用这个漏洞进一步提升到root权限。& c3 \$ @( \7 Z% D
3 \8 P/ Q9 G) L# z1 }
这种漏洞可怕在哪?
2 J* Y) t7 _* O. Q
: w n* H( G5 M+ f% ]它不显眼。它不是那种"输入框里填个单引号就弹shell"的漏洞。它需要你对系统有相当深的理解,才能构造出触发条件。
8 |, o8 H8 J. b9 C3 q* ?) O3 b% I* Y% l0 ^' k7 F+ U. p o* e
传统扫描工具扫不出来,是因为它的payload模式不在规则库里。AI不一样,AI学的是语义理解,它不是匹配特征,它是理解代码在"想什么"。1 [ Z& H4 Z. z% e2 c
0 F3 p5 Z3 s) T7 t! AFFmpeg那个例子更让我震撼。# [- l" ]5 @( P
- N8 l& W: }9 A" O; N5 K6 }& H
16年。, C- h- o, u6 H9 X( D
* @7 U4 P3 M: G0 z4 sFFmpeg上一次发现这种级别的漏洞是什么时候?2009年。) F1 i. }* D7 v1 o! g
o( N+ M: A" }/ g1 G
16年都没有人发现。然后Mythos Preview扫了一下,找到了。
+ d- [* Y" N. X; U% z. h) O$ d% W6 p" a3 u$ e* P2 D; A7 m' i5 J2 y
注意这个"扫了一下"的背景。SWE-bench测试集里,有大量是真实世界里的bug修复历史。FFmpeg这个bug在历史上真实存在过,是某次修复的时候被记录下来的。这意味着,Mythos Preview不仅能做代码审计,它能做的是:从海量代码里,识别出"这个写法有问题,即使目前还没有人报告过"。- b3 u) e( l- r6 B: d
0 j ]- P& l3 _0 X7 D这是主动防御,不是被动响应。
5 B; u; l0 @: @, @0 U/ k3 Q3 i0 _% q; Q( b. ]
传统安全的方式是:出了事 → 分析样本 → 提取特征 → 更新规则库 → 下次能识别。5 j p' c8 j- ?
* m1 S# N. r0 s
AI安全的方式是:不需要样本。直接读代码,告诉你这里有个洞。
3 `5 A; o2 W' [* n5 e9 w3 j% H9 c) L
4 s8 |2 s. P, h5 H$ j* c* ]+ t9 s这两者之间的差距,大概就是"等贼来了再装防盗门"和"在盖楼的时候看着图纸就告诉你这堵墙扛不住地震"的差距。# |/ [8 F8 C% r+ }; Y; X
. f. W7 Y$ a$ i% S现在说说大家最关心的问题:谁能用到,怎么用,花多少钱。4 L* d6 K7 l* g5 z3 [
0 n. \# Z3 G& y
Glasswing的AI能力,现在跑在三个平台上:Amazon Bedrock、Google Vertex AI、Microsoft Foundry。" ], T) |# O" W
' |# f5 R. ]( M
这三个平台,恰好是AWS、Google Cloud、Azure。全球三大云服务商。
0 X+ i6 p6 F9 q- p2 W+ j! W* ?$ n( T% `+ l4 Q
你在任何一个上面,都能调用Mythos Preview的漏洞检测能力。5 e5 v! N; y( K- H6 s. a3 V
+ {# T5 u7 n" E; x z. E/ ^价格呢?过了初始的credits之后,每百万token输入25美元,每百万token输出125美元。0 S Z8 o% N$ H0 N) N
. r& b; L. v" Z
这个价格贵不贵?
8 P! R2 R9 ?) w6 x0 _3 }/ w* T
& r" l4 `% v7 W; Q/ x对比一下就知道了。现在市面上做代码安全扫描的工具,像Snyk、Veracode这一类,商业扫描工具的报价大概是每个开发者每个月几十到几百美元不等。而且它们扫的是规则匹配,不是语义理解。# K3 r- o% v' i: I) z
9 ^- `) K7 l1 H
Mythos Preview能发现那些工具发现不了的漏洞。
% N& {; N# X* F, }5 u2 S: V/ ^, r$ o% w
这不是贵不贵的问题了,这是"有没有意识到你以前省的那些钱其实在交更多的学费"的问题。- S# \0 b( x; R6 k% c+ ?' g
# x- f. n, @3 C, Q2 R
另外,Anthropic自己掏了1个亿美元的使用额度,分给联盟成员和开源社区。还额外捐了400万,250万给Alpha-Omega/OpenSSF,150万给Apache软件基金会。
# Y: l- G+ E5 R. l7 L( B6 l0 f" w) P8 N- r. i# ?
这些钱是用来干什么的?让那些没有商业利益驱动的开源项目,也能用上最好的漏洞检测能力。+ Q1 q. u1 q6 _ Z0 J0 ]! c
; ?* i0 j' U! L1 b
FFmpeg就是开源的。OpenBSD也是开源的。这些项目没人给他们钱做安全审计,但他们的代码,运行在全球几十亿台设备上。2 ?6 b$ ?: y+ S+ J5 C% g
8 Y; d# K5 g% J
还有一个细节,我觉得特别有意思。( |$ a' J; S: }* t) J9 o# R1 C' M/ y
% h7 f0 ~& C+ h0 J4 n
漏洞发现之后,公开披露的时间是90天。: L+ w. Y' h- {4 h& s L
4 x1 {/ n) t6 j9 |7 P
90天是什么概念?+ k4 K5 R1 Q/ @( A: }9 V& l
( F- Z3 O& m) ]7 |* I) k行业标准的漏洞披露窗口是90天。这个时间足够让厂商评估漏洞、制定修复方案、推送更新,但又不至于让漏洞在黑市上流通太久。+ V1 p' D `, p4 Y( W4 R7 M
! C! C# V( c1 t: r7 o但这里有一个问题:90天是针对"有人发现了漏洞"这个前提来说的。
9 t- M2 U5 y5 {& S1 l
, E( t, \, @7 A- {* k$ bMythos Preview现在能以前所未有的速度挖出漏洞。它一天挖出来的漏洞,可能比以前整个安全社区一个月挖的还多。
# `8 n, r% g% B, A1 a
) G% |2 i- R/ e. w/ j这意味着,漏洞披露的节奏,整个就变了。
5 Q. m: C) w; O$ y. j$ e
5 A; K9 y2 x3 u* O* s# W7 t) e以前是"挖到一个,披露一个"。现在是"AI在持续不断地挖,每90天披露一批"。( Z) e; Y- A. ?4 k4 ]. S" Q' C
! T. N# E5 S3 b9 k, i
厂商的补丁开发速度,能不能跟上AI的发现速度?
. P4 F4 B7 k" G) }& u& @! @5 H5 H3 j7 ]! L8 O5 U
这个,我说实话,不知道。但我觉得,这是整个Glasswing项目最值得观察的地方之一。& v+ Z$ P* F/ [7 Y& h/ x5 Q; }6 m
7 F% D! w( W. C ?2 f2 u1 U写到这儿,我突然想到了一个更大的问题。, g; v( }9 H& U }
7 X& l8 C1 ^9 |1 H; z+ vGlasswing这个名字,本身就是一只蝴蝶的名字。玻璃翼蝴蝶。它的翅膀是透明的,像玻璃一样。! J! q0 E% j2 Z
: x" W2 t: R% K M: A+ D透明,意味着隐藏的东西变可见了。; b& c5 |8 x. E8 Q7 K2 z
$ g4 x! U; r7 w8 T& k
一只蝴蝶的翅膀是透明的,它就隐藏不了任何东西了。它在哪里,飞向哪里,所有捕食者都看得清清楚楚。" A" [3 ^) |- X9 m e. L% s' o7 l
2 Y. M2 i2 k0 q% ^, v这个意象,放在漏洞挖掘上,太精准了。- h; n+ N% b( _; w- c$ Y
" U6 L: {$ H/ V+ M" z$ s7 A代码里那些隐藏了几十年都没人发现的漏洞,在AI的"眼睛"之下,突然就透明了。
5 a. w1 J- t8 l& b9 p8 G0 a/ s* d! C! g# b$ g6 p8 ^7 {
以前我们说"security through obscurity"——通过隐藏来保证安全。你的代码不公开,漏洞藏在暗处,攻击者找不到。- I0 t3 f6 o: `
4 N& @4 _0 I- S2 \
但现在,只要代码存在,AI就能读。Mythos Preview不需要你的代码是开源的,它只需要能接触到代码——不管是源码、还是编译后的二进制、还是运行时的行为轨迹。
, q$ G/ [" `7 g0 o/ _8 Y& K( K
) }' v0 Y/ i% _$ e; S代码越来越难藏了。或者说,代码里的漏洞越来越难藏了。
$ k U% s: I: t% M6 T+ i0 d& D9 Z# x8 l
这是一件好事吗?
; j$ `7 k( G$ {. G$ {: _+ z) h$ B- L, _" o
我觉得,短期内,这是一件非常非常好的事。2 j9 [* m; o: p. H4 I$ o
# p, _2 i1 q2 p
全球互联网基础设施里,有多少代码是10年、20年、30年前写的?没人敢审计、没人敢动、出了问题就打补丁接着跑的,有多少?
0 M+ W$ r' v) N- R, @' ^) n: [: F, G# ?' U- U3 g( X+ h
这些代码就像一颗颗定时炸弹,埋在整个数字世界的基础里。& c0 ^ N" s# B0 i1 a; z- [
' g4 H& e+ X8 A5 K( yAI能做的是,帮我们把这些炸弹找出来,一颗一颗地拆除。! ?* Q, p! c( m. h/ s2 c
: t! g: |2 b M* l1 ~+ D+ w但长期呢?
/ r+ ^" x9 H+ l F# ~
) r2 Z E$ O/ {0 X& E' E7 W$ W1 d当所有可见的漏洞都被AI清除干净之后,剩下的,是什么样的世界?
! A2 b( g! b. u6 I, k( H: G; R B8 C8 v' u
是代码质量极高、安全性极强的一个世界?还是所有攻击者也在用同样的AI,攻击的速度和防守的速度同步提升的一个世界?0 z* {% p" q0 h! l
1 Y9 \, }" Z( J& G6 ?3 E1 J4 K我也不知道。1 e6 ^# B% b% j! W
' F! E" U0 f: v0 o0 \
但有一件事我特别想强调。
N+ | ]3 i* Q
2 N8 D! b/ \8 I- D/ B' F5 ]0 z这次Glasswing联盟里,有JPMorganChase,有CrowdStrike,有Palo Alto Networks。这些公司,是真正的安全重度用户。( x: V7 P% b; q; S0 F! v" O5 r
. Z% F/ Z: h( U+ v$ K0 e他们自己有能力挖漏洞吗?当然有。JPMorganChase的安全团队在全球排前列。CrowdStrike就是做安全的。
) U! Y h0 I* |
$ Z* s0 `4 F' ~他们为什么还要加入这个联盟,用别人的AI?9 ?5 ~5 l1 Y0 k. K
- A1 e' K3 i& p1 X# V G# V, K我大胆猜测一下:因为挖漏洞这件事,规模太大了。
7 B1 u9 ^# ^3 f2 b9 W4 j2 y* p8 o8 A1 N z3 x) l
全球代码量太大了。每一家公司,即使安全团队再强,也只能覆盖自己的代码库。但外面的供应链、开源组件、合作伙伴的代码,你根本管不到。
! h) u) f" a/ }+ q- h' f+ }
: n5 g4 w$ I2 G A) a: [; lMythos Preview的价值,不在于它比你的安全团队强。而在于它能同时扫所有地方。4 i+ v8 @/ y4 h0 {4 V5 z
/ f& Q8 @. [0 H5 o! _- }- w这是规模效应。9 z, ] ? w+ y
9 U* W7 v, B& s% y; }: I/ ?: M; F就像打补丁。手工打补丁,你只能打你知道的那些机器。自动化打补丁,你能打你所有的机器。AI扫漏洞,相当于在每一个代码提交的时候,就自动扫一遍。. S D% [/ A% G
" \; u+ S& Q1 k2 a M
这个规模,是人类团队根本无法覆盖的。
/ z* ]0 S; `& b$ Z& J& J4 T! W( J6 `+ [, r6 ~( j
Glasswing这个项目,还有可能往一个方向发展——成为一个独立的第三方机构。
$ P2 v- ~6 ^6 S9 @& Q
/ `/ F* K& C) Z& D# X& [3 `什么意思?- C& s, R0 M/ M) Z/ l: @
8 p3 r: Z/ j8 c0 d$ W$ R现在它还是Anthropic牵头、11家公司参与的联盟。但未来,它可能变成一个真正独立于任何商业公司的安全机构。它的评估结果,有公信力;它的漏洞报告,有权威性;它给出的安全评级,整个行业认。
7 ^% v+ b+ ^- ^ [# M8 g5 D2 Z ^- M0 a# ?; m6 ~ T4 g
类似现在的ISO认证,但针对的是代码安全。
/ |+ i" h% u v* V+ T
4 U" `8 F3 n3 U3 Q7 H/ L% r想想这个画面。未来的软件采购,合同里可能不只要写"符合SOC2",还要写"通过Glasswing认证,漏洞数为0"。
6 j5 W/ R2 }4 l# K% R3 R+ ^9 S. Z; j. g3 y) _" C- F$ P% b
这不是不可能的。: G3 ]$ T% M4 a' f4 L! w$ `$ v1 ]$ C
8 D) P! r4 _* A
当然,路还很长。现在还只是第一步。但方向是对的。
1 @" N" ^" J, D" s% V- ?
- L; S# @& u5 `/ f5 c好了,写了这么多,让我最后说几句掏心窝的话。" A8 i% u" G) G+ U5 B5 ^
: X# o: B/ X H+ z
我这次看到Glasswing的新闻,第一个反应是兴奋,第二个反应是有点怕。
1 k) x, c2 @* s4 d a; p/ s, ^
* E1 s4 E4 m0 q; [# v* O兴奋是因为,我真的觉得,这是AI在安全领域做的最有价值的一件事。以前我们聊AI安全,大家想的都是"AI能不能被攻击"——对抗样本、数据投毒、模型劫持。这些很重要,但离普通开发者很远。 c0 S# l. u/ I# Q G
7 ^3 d3 |. t @; l* p% q: r这次不一样。这次是AI在帮我们发现自己的脆弱点。
9 J) h2 i+ Y' [4 L/ y* ^
; Z8 N. @% g3 [# T这种脆弱点,我们以前不知道,或者知道但没有能力发现。AI把它们挖出来,摆在阳光下,告诉你这里需要修。' M4 J0 ]! p6 ?+ [: `8 q
9 o* C! K' a/ b& C/ R6 N这是AI在补人类的短板。不是在超越人类,是在帮助人类补上人类自己够不到的地方。3 O! ~; B: p5 {
% @$ c& F8 u$ t% j x我怕的是什么呢?# ~2 c7 I, D1 q* a g
6 G- M) @% u `+ U! F- V( `
我怕的是,这个工具,只有大公司用得起。' ^( x: R4 L( |5 r& F: x X
+ R& P$ E# m* |0 M& V8 G0 AAWS、Google、Microsoft,Bedrock、Vertex AI、Foundry。这些平台,都是商业平台。Cloudflare这种中型公司,可能用起来没问题。但那些真正需要安全检测的——初创公司、开源项目、十几人的小团队——他们能用到吗?" `2 i+ ]# i3 s- u$ r6 v7 R1 S* I, x
2 X7 ?4 {3 m# J* C9 S. N
Anthropic捐的那1亿美元额度够用多久?分到全世界的开源项目上,每个项目能分到多少?
: N; n) ~2 k+ T8 } ?2 {7 X( \
' v0 t8 v+ H9 l, W! ]' p7 u这些问题,现在还没有答案。
) R8 `6 @6 n+ F9 I0 C% t |8 T
- e0 b( i7 a! W$ Q9 ~/ u但有一点我特别想强调。
2 Z. q4 l; R1 ^* H& k, Z$ R; R6 c7 g8 v2 w) I, ]" g! |/ H2 C
Glasswing这个项目,让安全这件事,第一次真正有了一种"基础设施"的可能性。5 B7 {/ y; M# [% n
* C |; s# a+ E+ f2 f* P2 d! ^5 m以前的安全,是奢侈品。你要么雇得起安全团队,要么买得起企业级扫描工具,要么你就裸奔。
5 k/ Z/ ]6 U' S6 D& Y# L
+ v& a$ a F0 b3 U- U/ aAI改变了这个等式。Mythos Preview能发现那些企业级工具发现不了的漏洞,但它的调用成本,并没有比那些工具贵多少。- ?" V3 p$ h5 q* J, J( l0 u
8 x- ]* ` t2 e3 N5 P" a
当漏洞挖掘的成本持续下降,当AI扫描变成每一个代码仓库的标配,我们或许真的会迎来一个更安全的互联网。
2 ]+ Z- H6 `& K& m; i* A) i! X5 P C( ?5 i# g) @
这一天什么时候来?我不知道。可能5年,可能10年。6 G, @9 d0 {3 e, i. Q
4 m: E4 s3 P* j9 h2 Z但Glasswing,让我第一次觉得,这件事不是痴人说梦了。; x# i9 L- [; L+ l! x! a4 g0 F
|
评分
-
查看全部评分
|