爱吱声

标题: 玻璃之翼降临——Glasswing计划与Claude的Mythos Preview [打印本页]

作者: xiejin77    时间: 前天 07:45
标题: 玻璃之翼降临——Glasswing计划与Claude的Mythos Preview
玻璃之翼降临——Glasswing计划与Claude的Mythos Preview
) K# w7 a( h0 L, x: R; r% E/ s& O. t* E! c* S1 T: E

. E4 q- Z# G% V% L0 P/ D5 l一个预览版的AI大模型刚刚挖出了一个尘封27年的漏洞,然后11家科技巨头都坐不住了……1 w3 o( r& M. ?1 W) D
, G4 h3 w( p1 ?. q& f% p3 {9 o4 x
故事是这样的。" w. Z6 u5 X* Z% M, q7 i6 q

5 R5 p' F( P! _1 ]9 s' {- ~7 {; J4 e1 v我今天看到这个新闻,看完之后愣了好几秒。
0 j! `. K5 `% D3 i2 d
/ K! I4 e* ^2 B9 F  ?! s一家叫OpenBSD的公司——做操作系统的,算是安全领域的老前辈——他们有一个漏洞,在代码里躺了整整27年。1998年写进去的,没人发现。# U0 i+ Q% f7 a8 ?) ^

$ c: y' D' z( y4 t结果被一个AI模型给挖出来了。
3 [! ?  S# P1 c- K' ]: M- E" I& G: p+ A& v0 m6 d3 g3 K5 `( U
这肯定不是那种"我们用AI扫了一下代码库发现了问题"的挖出来。而是那种"这个漏洞藏在最核心的地方,所有传统工具都扫过5百万次,一次都没报过警"的条件下挖出来。
$ Z% ~( c+ D; s' r! `: L4 A. @$ W2 S3 u( O6 `
然后,这个AI模型,顺手还把FFmpeg里一个16年的漏洞也给挖了。+ \% w/ o) M7 t2 ~7 f* \) E
6 B2 ^- n7 J4 B7 g7 p1 ?/ V/ q* e0 k" G
FFmpeg,音视频处理领域最最最核心的基础设施。全世界的视频播放器、浏览器、直播平台,有几个不是建立在FFmpeg之上的?这个漏洞在里面藏了16年。5百万次自动化测试,没一次报过警。
) B. }* a( |% P* l8 l: t  L
) T- K- m3 C  G# [- M5 t2 t然后呢?' P2 v; g* h1 X

8 o. E7 R1 O! T8 t# d4 N然后,11家全球最大的科技公司——Google、Microsoft、Apple、NVIDIA、CrowdStrike、JPMorganChase、Google等等——坐下来,说了一句话:我们一起出钱,让这个AI模型,能被全世界的安全研究员用上。
* a( s- ]. S8 k2 h' A3 D
2 |0 k) b8 T! A这个项目,叫Glasswing。

5 N2 N; `$ }$ r% J! f( H! j# W' z
. W# ^3 [$ m3 [4 @; W5 T7 [
glasswing
/ M& R+ g3 i' {: O: f% r+ d* K6 V% h% |0 F  e

& F! m' s' L0 A7 c! |先说清楚Glasswing是什么。4 b* _& T* t! r; c3 Z
" i$ |  N  G7 h0 ?! X4 C, E
简单说,它是一个AI安全联盟。发起方是Anthropic,加入方是一堆哪怕是不关注技术领域也叫得出名字的科技巨头。它的核心,是一个叫Claude Mythos Preview的模型——注意是Preview(预览版),就是还没正式发布的那个版本——专门训练来挖漏洞的。  e9 z, Y9 R8 ~1 B3 j, M: V3 T& o* L
# P( `! s; D0 z% A
有多强呢?. p6 S7 k0 b- n

& ~% i8 ~. W0 g/ [, tCyberGym基准测试,83.1%。作为对比,Claude Opus 4.6,得分是66.6%。不是Claude Opus 4.5,是Claude Opus 4.6,Anthropic目前最强模型。6 E" t! i  Z" C

* g/ {% u* w2 M# H0 N3 Z; o+ [SWE-bench Verified,93.9%。还是SWE-bench Verified,不是那个容易一点的版本。Claude Opus 4.6是80.8%。( n4 ^6 \7 s0 f4 a7 b+ s- O9 _

- n1 P3 M6 B3 o1 m8 s; W& z差了13个百分点。
6 X* P0 A: `6 w2 T8 d+ r4 I8 |
: m' e3 v$ g% t$ N0 {- Y1 D) `你说这13个百分点意味着什么?: x2 R; o3 r  l; y
- ~% F  j/ W/ d4 N/ t; E6 p
意味着,传统扫描工具漏掉的那些最刁钻的漏洞——那些藏在层层调用关系里、藏在异常分支里、藏在并发边界条件里的漏洞——Mythos Preview能找到。
8 m# H( `7 ~$ c3 t0 b. f; [
; a9 t9 ~2 f' z0 \- `意味着,27年的OpenBSD,16年的FFmpeg,以后可能不会再有了。- G+ F" p; e/ @0 ^
! ~5 ~+ Q" @+ d
或者说,这种级别的漏洞发现速度,会比以前快几个数量级。
0 c8 y6 @. G, d$ i$ J2 t
* ^" g* ?$ f2 M& p+ ]% {+ s$ w说到这个OpenBSD的漏洞,我必须展开讲一下,因为这个例子太有意思了。& B" @" C8 W' S" k: Z
/ L( }9 D" q# F' L
OpenBSD是个什么存在?9 S2 T1 W! G* S3 v' v6 L
: }+ E( A% e3 E6 T0 a* ^! q
它是BSD操作系统的一个分支,最核心的设计哲学就是安全。代码审计之严格,在整个开源社区都是有名的。很多安全研究员的信仰级操作系统。, v$ R: Z$ L: L: P+ R
3 {. g* d- x: v9 O6 G' K* |
这样的项目,代码审计了多少年了?二十多年。
# t! j1 J) B! c6 y( r2 O; {' H+ v0 f  D8 B. K
然后,一个漏洞,在里面躺了27年。5 \; V, d# R5 x$ X
: ]) p' \1 D0 j/ G2 Z
这说明什么?5 C' K+ G/ O4 n
6 Y! y( J. w# f, s
不是OpenBSD的人不行,是传统的审计方式有盲区。任何人工审计,只要时间足够长、人足够累、代码足够复杂,就一定会有漏洞漏过去。这是人性的边界,不是能力的边界。
- \1 f) a! [9 t9 o1 q% d! ?) X, w- _& Z4 q1 J! a
但AI不一样。AI不会累。AI不会因为审了三个月之后注意力下降。AI可以在几个小时之内,把整个代码库的所有调用路径、所有边界条件全部穷举一遍。! ^% g* J4 j7 E  C
7 H( `) e" o+ A1 m9 ~
Mythos Preview发现的那个OpenBSD漏洞,是一个本地权限提升漏洞。攻击者如果已经拿到了一点点访问权限,可以利用这个漏洞进一步提升到root权限。
+ r, v/ }' t% k7 i) `' r9 j
- I" T8 P5 C% f; X. y这种漏洞可怕在哪?
- `+ J, F) X% x& x3 y- S' p# H  O# `5 z$ I5 ^
它不显眼。它不是那种"输入框里填个单引号就弹shell"的漏洞。它需要你对系统有相当深的理解,才能构造出触发条件。  ?# y4 F) Q7 R9 I
3 D* Y/ x0 ~  b3 L* T, L
传统扫描工具扫不出来,是因为它的payload模式不在规则库里。AI不一样,AI学的是语义理解,它不是匹配特征,它是理解代码在"想什么"。7 z5 I* C6 q# Z4 }9 z
' U1 J) ~" l- U$ J" p
FFmpeg那个例子更让我震撼。# B: M( a- ^7 Y* A" U' [

9 V4 V5 Z& W1 z! v6 ?+ B16年。
$ Q4 ~9 D- K$ o7 U3 X& ~- K9 O1 M2 ~+ w
FFmpeg上一次发现这种级别的漏洞是什么时候?2009年。
) v7 V; i: g+ A3 @& D( w) {' g& M: S  H
16年都没有人发现。然后Mythos Preview扫了一下,找到了。* o1 b+ X+ J+ A: }1 N/ d+ F5 e
: }6 m# T5 r/ u% |: E2 U' Z
注意这个"扫了一下"的背景。SWE-bench测试集里,有大量是真实世界里的bug修复历史。FFmpeg这个bug在历史上真实存在过,是某次修复的时候被记录下来的。这意味着,Mythos Preview不仅能做代码审计,它能做的是:从海量代码里,识别出"这个写法有问题,即使目前还没有人报告过"。
' E( K' g$ y* B. T
/ n) a: q9 e  F3 A0 [这是主动防御,不是被动响应。3 G# ]0 ~3 C7 D$ {' F/ |$ v+ h* C$ a

1 h: J+ i9 n5 m# h" J  B1 Q传统安全的方式是:出了事 → 分析样本 → 提取特征 → 更新规则库 → 下次能识别。/ m5 _. e; q% t
% X1 E. u$ R5 }- F4 i# }  t
AI安全的方式是:不需要样本。直接读代码,告诉你这里有个洞。
: R% [  d2 C- K* Q$ |+ X& r1 G$ U! ]+ B) L
这两者之间的差距,大概就是"等贼来了再装防盗门"和"在盖楼的时候看着图纸就告诉你这堵墙扛不住地震"的差距。; l& s* q0 j4 w6 m0 [

! O( ?! j8 L) a0 B现在说说大家最关心的问题:谁能用到,怎么用,花多少钱。$ `3 ]2 G0 @+ x- t1 }
* S/ ^; f' x- x" [$ `
Glasswing的AI能力,现在跑在三个平台上:Amazon Bedrock、Google Vertex AI、Microsoft Foundry。# g, G+ k0 m/ ]& P4 ?
) j+ W, ?' w. r7 S6 l; i( d4 f. y
这三个平台,恰好是AWS、Google Cloud、Azure。全球三大云服务商。
( ~" h* q" h! X. s9 }( @1 I; p% Y9 |, B: ^9 g* P
你在任何一个上面,都能调用Mythos Preview的漏洞检测能力。
+ D4 g4 T4 `; _1 ?  p
' l/ j9 A- o" g& }价格呢?过了初始的credits之后,每百万token输入25美元,每百万token输出125美元。' u$ t9 V. i$ v. f, M7 H
3 r* R) i. c, m0 h( J& v
这个价格贵不贵?
# X, Q) c! e* Z2 p
+ h6 m2 C: Z, r! ?8 z. j+ R/ Y对比一下就知道了。现在市面上做代码安全扫描的工具,像Snyk、Veracode这一类,商业扫描工具的报价大概是每个开发者每个月几十到几百美元不等。而且它们扫的是规则匹配,不是语义理解。( H- q/ q5 l# [9 \
! X8 K, t5 J8 o
Mythos Preview能发现那些工具发现不了的漏洞。* d0 R/ p; Q" w9 t. @! k
* p2 x9 d$ y# _% p5 v$ m
这不是贵不贵的问题了,这是"有没有意识到你以前省的那些钱其实在交更多的学费"的问题。
) \& ], ?7 U$ [) T- Z0 P9 F' G
, \, \% B6 \7 J0 J另外,Anthropic自己掏了1个亿美元的使用额度,分给联盟成员和开源社区。还额外捐了400万,250万给Alpha-Omega/OpenSSF,150万给Apache软件基金会。2 n3 ?1 O, z3 B; x4 s% `9 m
8 x+ V  n, S# P* A
这些钱是用来干什么的?让那些没有商业利益驱动的开源项目,也能用上最好的漏洞检测能力。* e2 d. j$ ^: |4 o' A5 `

' t1 [" W) i( O5 Q5 \: C1 S4 V" qFFmpeg就是开源的。OpenBSD也是开源的。这些项目没人给他们钱做安全审计,但他们的代码,运行在全球几十亿台设备上。) D, u$ x( Q% x. G$ o- U2 P
, C7 J  |* n& Z  W8 j' u+ }) ?
还有一个细节,我觉得特别有意思。+ X- ]$ g& m5 c; {6 L
# G! {" W9 n* }. r; g
漏洞发现之后,公开披露的时间是90天。
) T0 D# d( q( }. J5 E6 h1 d
2 U' B6 L2 W& ]6 v# l4 K6 i0 L8 m90天是什么概念?
, A) M+ a8 b+ Z4 e' Y
  g  L/ c+ S2 N( d  v: P+ q4 `2 z行业标准的漏洞披露窗口是90天。这个时间足够让厂商评估漏洞、制定修复方案、推送更新,但又不至于让漏洞在黑市上流通太久。/ a) m9 }7 I: l4 E# ]+ w# [/ ^( k

) w, T' R3 ~) j但这里有一个问题:90天是针对"有人发现了漏洞"这个前提来说的。
8 g' Y  f$ t0 }' d4 O& ?3 Y
. K& b/ f$ e3 C; ^. [6 L; aMythos Preview现在能以前所未有的速度挖出漏洞。它一天挖出来的漏洞,可能比以前整个安全社区一个月挖的还多。
+ ~5 A% h! k* o
" p1 c: f8 ~7 c8 L, I- r  J9 Q" v. I5 d这意味着,漏洞披露的节奏,整个就变了。
$ \7 l9 R7 [% f4 M( I6 ]% G% o+ @4 P4 N
以前是"挖到一个,披露一个"。现在是"AI在持续不断地挖,每90天披露一批"。
" z! s$ F! u+ e- I/ D* T
4 |- y% Q% ~8 V5 D) A  g厂商的补丁开发速度,能不能跟上AI的发现速度?2 D# j7 f7 a7 |7 t$ [; B. U
4 }5 B& y8 B* P
这个,我说实话,不知道。但我觉得,这是整个Glasswing项目最值得观察的地方之一。
- M% o4 b  C1 [
+ |+ h6 a" w9 n3 c! F写到这儿,我突然想到了一个更大的问题。. p" s! J0 S7 ~

' a4 i5 ~+ m8 jGlasswing这个名字,本身就是一只蝴蝶的名字。玻璃翼蝴蝶。它的翅膀是透明的,像玻璃一样。
  g! S% _/ H$ D: \9 [% A! R9 |% U4 {$ L4 _# q
透明,意味着隐藏的东西变可见了。9 v( \6 ^' ?/ E8 c) {0 U0 W1 K$ v5 V
) p& b! G. f' I: \! z
一只蝴蝶的翅膀是透明的,它就隐藏不了任何东西了。它在哪里,飞向哪里,所有捕食者都看得清清楚楚。9 @& c' {6 b7 B/ h) ^7 U

- z( w1 _+ M) J3 a这个意象,放在漏洞挖掘上,太精准了。
: ^2 p% G, W& |% j: I0 U
5 W! \4 \" E5 U- c! G1 t3 ?) y9 m# o代码里那些隐藏了几十年都没人发现的漏洞,在AI的"眼睛"之下,突然就透明了。* B" B+ M. b! a% C# I$ b1 \# F

3 N. t' s9 s, N以前我们说"security through obscurity"——通过隐藏来保证安全。你的代码不公开,漏洞藏在暗处,攻击者找不到。
7 c) X# b; A1 l: K, Q# P. D% g; o# U$ \  C7 Z
但现在,只要代码存在,AI就能读。Mythos Preview不需要你的代码是开源的,它只需要能接触到代码——不管是源码、还是编译后的二进制、还是运行时的行为轨迹。  Y5 ]! S& T# B2 R' f* V; ?

: _1 j' W# M' C0 J# q代码越来越难藏了。或者说,代码里的漏洞越来越难藏了。
$ b/ C# G) O; g; B2 D( c( F: t2 g7 k5 Q  y8 ^5 ~
这是一件好事吗?
' o: O9 E4 o! r8 i  L. e- I. x# ~
3 Y7 q6 d8 V  X* C% e* c! K我觉得,短期内,这是一件非常非常好的事。' n0 o$ H$ Z5 o4 Y/ p
/ u3 A1 y+ I6 C. h" c4 t% k
全球互联网基础设施里,有多少代码是10年、20年、30年前写的?没人敢审计、没人敢动、出了问题就打补丁接着跑的,有多少?6 v& C& c" Z. ]) a& }
2 }0 s" q' N8 A
这些代码就像一颗颗定时炸弹,埋在整个数字世界的基础里。
' B8 R7 i. U5 o  Q; H4 K! c( d; B+ P. C8 V) }% ?% v
AI能做的是,帮我们把这些炸弹找出来,一颗一颗地拆除。5 S" [/ u/ P5 {3 T# ?/ s+ o$ l

) d$ D* {! W1 j% ^但长期呢?
/ m" ?/ |9 f) L: g) ]9 p1 Y  \. c1 `; u( i
当所有可见的漏洞都被AI清除干净之后,剩下的,是什么样的世界?6 W1 V# ~" H% J4 r1 s5 a4 j
8 S% {  Z; u  T& k" q# F. t' s
是代码质量极高、安全性极强的一个世界?还是所有攻击者也在用同样的AI,攻击的速度和防守的速度同步提升的一个世界?8 P) L* c3 N& J: u! P

; X0 D/ o" p: m7 ~6 ?! u我也不知道。
3 K2 L0 o0 s# V5 p0 _8 l' M! x" K, o( M) I( A
但有一件事我特别想强调。/ V6 B4 a$ u$ q/ q# w
4 P6 `. I9 ?; K) `: J
这次Glasswing联盟里,有JPMorganChase,有CrowdStrike,有Palo Alto Networks。这些公司,是真正的安全重度用户。
3 V6 t' t) ~) S& ^, o
0 G( C7 S3 F/ i- @  a3 @他们自己有能力挖漏洞吗?当然有。JPMorganChase的安全团队在全球排前列。CrowdStrike就是做安全的。3 \* s2 I- B: C' I

! _. n7 G" E- J6 n+ F他们为什么还要加入这个联盟,用别人的AI?
- t1 S- E3 i9 U; X" u
- @$ m4 q% z" o+ N4 a* W* k我大胆猜测一下:因为挖漏洞这件事,规模太大了。- o6 K5 o, {! c$ p, n4 P2 b2 z9 S

5 c( Y) P& P8 {% Y全球代码量太大了。每一家公司,即使安全团队再强,也只能覆盖自己的代码库。但外面的供应链、开源组件、合作伙伴的代码,你根本管不到。' ?+ C# Y) `$ y/ R+ S4 T8 [
$ h! w/ v* N  G
Mythos Preview的价值,不在于它比你的安全团队强。而在于它能同时扫所有地方。
- D5 j6 i2 F2 L7 T, R; L' |/ A$ @" S: [3 D/ b# ]
这是规模效应。
5 G0 \+ u: [) K! ^  P0 M# j% Z, X; t( d& L2 M
就像打补丁。手工打补丁,你只能打你知道的那些机器。自动化打补丁,你能打你所有的机器。AI扫漏洞,相当于在每一个代码提交的时候,就自动扫一遍。; y9 M! s. w7 b1 d

( Z( i1 G, h1 w6 p! s这个规模,是人类团队根本无法覆盖的。0 }% v" _" q* K. J5 s2 U

2 G1 k; a* F% x4 kGlasswing这个项目,还有可能往一个方向发展——成为一个独立的第三方机构。7 j+ k5 s4 |5 a
+ [  Z; U1 M) x4 d. E2 g
什么意思?
8 m  [% d2 {; K+ U
" i4 Q2 w: c+ z; k: r& e现在它还是Anthropic牵头、11家公司参与的联盟。但未来,它可能变成一个真正独立于任何商业公司的安全机构。它的评估结果,有公信力;它的漏洞报告,有权威性;它给出的安全评级,整个行业认。( K" \/ n( R2 R5 C# A! Y

0 u1 w! n9 {0 x& r" ^% N) \类似现在的ISO认证,但针对的是代码安全。
' S; v: B+ m5 Q  P: U0 T4 O# S
  x6 k) A8 `; x3 d想想这个画面。未来的软件采购,合同里可能不只要写"符合SOC2",还要写"通过Glasswing认证,漏洞数为0"。
; V# l/ \* v! S' ^: I6 _* b! a$ q. a/ v) j: Z' t3 ?2 c
这不是不可能的。, I1 j+ J8 Z7 t4 A( T" w0 x& `2 {
( _, S+ a3 m# d& f1 k: [2 u
当然,路还很长。现在还只是第一步。但方向是对的。
0 m; P% H# o  P2 Z' }7 }, M+ S0 Y8 b7 J. \1 V: Q
好了,写了这么多,让我最后说几句掏心窝的话。/ M* E6 P& l, U% v- j1 G) m: ]
5 p6 `0 z1 G( j$ X1 k8 h; z
我这次看到Glasswing的新闻,第一个反应是兴奋,第二个反应是有点怕。" G/ I: w* C! e% Y) Q3 B# x7 o$ e+ j
% z! Q9 S, M* l9 W1 k
兴奋是因为,我真的觉得,这是AI在安全领域做的最有价值的一件事。以前我们聊AI安全,大家想的都是"AI能不能被攻击"——对抗样本、数据投毒、模型劫持。这些很重要,但离普通开发者很远。
* _- H/ U5 e$ V9 M- \
! Q! a% o. i) z! ^9 ]这次不一样。这次是AI在帮我们发现自己的脆弱点。
2 n1 X& u1 Z& ~' ]) |: O2 X1 m2 o5 ^7 N/ H
这种脆弱点,我们以前不知道,或者知道但没有能力发现。AI把它们挖出来,摆在阳光下,告诉你这里需要修。
+ G) J1 Q/ V# D0 N3 x  ~2 n$ U( e
& U# j5 K' ]4 R$ k这是AI在补人类的短板。不是在超越人类,是在帮助人类补上人类自己够不到的地方。
% |3 ^  ^4 w; S3 {9 @) e
' A" p) i: U! {. X  v: x+ [我怕的是什么呢?
' a- x. j7 v, ?  \& X3 z: ^0 r" _
我怕的是,这个工具,只有大公司用得起。: E( W! {. _* ]- K  G" J

* j& g+ L# z! A3 Y  ?0 N4 w, {AWS、Google、Microsoft,Bedrock、Vertex AI、Foundry。这些平台,都是商业平台。Cloudflare这种中型公司,可能用起来没问题。但那些真正需要安全检测的——初创公司、开源项目、十几人的小团队——他们能用到吗?1 V$ g# {1 C+ i; x4 Z* ^
$ D5 p4 I6 n* Z, E$ `3 E* W
Anthropic捐的那1亿美元额度够用多久?分到全世界的开源项目上,每个项目能分到多少?
* u- J  H7 P! z' l1 N! G+ f1 c3 g/ B; n& B
这些问题,现在还没有答案。
, h4 ]$ U/ l8 g( L1 K, |2 c7 p% {. A  K0 o+ U
但有一点我特别想强调。
: x' A  E$ d5 w. f
$ ~6 d. j0 j7 T* wGlasswing这个项目,让安全这件事,第一次真正有了一种"基础设施"的可能性。
0 C# |( W7 X* M; a
# h8 a0 y, h5 `" D: H以前的安全,是奢侈品。你要么雇得起安全团队,要么买得起企业级扫描工具,要么你就裸奔。! e# \) L1 J$ k+ A
; \' w  S) H0 {% h# j' u# J
AI改变了这个等式。Mythos Preview能发现那些企业级工具发现不了的漏洞,但它的调用成本,并没有比那些工具贵多少。% u4 v2 v$ Q& |& c
* t: L$ J- A7 o) h
当漏洞挖掘的成本持续下降,当AI扫描变成每一个代码仓库的标配,我们或许真的会迎来一个更安全的互联网。6 b' [. Y: Z  S  U# q7 k) e

7 o2 P0 r' W, u: J0 ^这一天什么时候来?我不知道。可能5年,可能10年。
. v& I0 j0 [4 e- A9 z, l, v; W0 b5 l$ @8 x- j2 l5 |
但Glasswing,让我第一次觉得,这件事不是痴人说梦了。

3 m) |# Z8 @% L% ~1 X# z, |( D. ?/ t
作者: aniu    时间: 前天 09:53
联想到了Snowden曝光的棱镜PRISM
作者: xiejin77    时间: 前天 09:56
aniu 发表于 2026-4-9 09:53, f3 A: f) k' Z+ Y- ~6 _! P
联想到了Snowden曝光的棱镜PRISM
- Q* C, F5 y) ~  ]9 _- z% y
大模型大大降低了此类工具的门槛,之前国内的安全夺旗竞赛,几个夺冠的团队好像都用了AI,最狠的一个用了五个codex自动渗透攻击;反复迭代。




欢迎光临 爱吱声 (http://aswetalk.net/bbs/) Powered by Discuz! X3.2