爱吱声

标题: 玻璃之翼降临——Glasswing计划与Claude的Mythos Preview [打印本页]

作者: xiejin77    时间: 2026-4-9 07:45
标题: 玻璃之翼降临——Glasswing计划与Claude的Mythos Preview
玻璃之翼降临——Glasswing计划与Claude的Mythos Preview
! R, z, z& y9 ^/ x" P" [) b
: j7 H3 a8 V9 p1 f( _( [7 x6 {* y% J6 B) [
一个预览版的AI大模型刚刚挖出了一个尘封27年的漏洞,然后11家科技巨头都坐不住了……
' e* A- Y& p" u5 t5 K( \. i7 ?* q' k3 a2 L) g
故事是这样的。6 |/ c! P0 l& |- h0 {

; L1 a8 f6 f! h; W4 D! `) \我今天看到这个新闻,看完之后愣了好几秒。
7 p8 b2 x9 x4 {5 Z8 u0 E7 t# M' D- p+ O. S7 o
一家叫OpenBSD的公司——做操作系统的,算是安全领域的老前辈——他们有一个漏洞,在代码里躺了整整27年。1998年写进去的,没人发现。" E) i; y% m$ O0 G& I4 l% F" s5 Q
4 r+ }1 a- \* l% E
结果被一个AI模型给挖出来了。
( k1 ?% j4 V2 O4 ]$ ~3 Q; F6 l, o' }# y/ R" S6 r
这肯定不是那种"我们用AI扫了一下代码库发现了问题"的挖出来。而是那种"这个漏洞藏在最核心的地方,所有传统工具都扫过5百万次,一次都没报过警"的条件下挖出来。
" ^4 r! J, s% B' p
+ i+ W! q+ B# x6 ~/ e然后,这个AI模型,顺手还把FFmpeg里一个16年的漏洞也给挖了。
/ j* o. B/ E7 t8 `& c1 S: t& Z6 ^- d) [: I) W: Q' U
FFmpeg,音视频处理领域最最最核心的基础设施。全世界的视频播放器、浏览器、直播平台,有几个不是建立在FFmpeg之上的?这个漏洞在里面藏了16年。5百万次自动化测试,没一次报过警。: |. b* q3 T: ~$ s1 t# d6 q

0 i. R" X, q% b; q( B1 Y然后呢?. n4 Y% I3 E% j6 `& ~5 M. a
" [" L* W, j2 o& ]3 z5 [$ N  l$ N
然后,11家全球最大的科技公司——Google、Microsoft、Apple、NVIDIA、CrowdStrike、JPMorganChase、Google等等——坐下来,说了一句话:我们一起出钱,让这个AI模型,能被全世界的安全研究员用上。0 H; e1 z: f  P  V  e2 U

& R# K8 F' l" V" q6 b% {3 D& \这个项目,叫Glasswing。

$ w0 l5 F3 X# S, r1 n* I+ U+ E6 i+ c

: |3 X! W) s. u; p0 t* tglasswing
& T/ v4 Z& \9 P# g2 Y& C  J) q* G8 L7 Z) L/ x

8 z1 W; D! y8 f7 I- F先说清楚Glasswing是什么。8 M; ~5 _, c. G+ X# @& ^
5 b% N$ Y" p2 i* q8 T2 w
简单说,它是一个AI安全联盟。发起方是Anthropic,加入方是一堆哪怕是不关注技术领域也叫得出名字的科技巨头。它的核心,是一个叫Claude Mythos Preview的模型——注意是Preview(预览版),就是还没正式发布的那个版本——专门训练来挖漏洞的。# ?2 i2 B& K1 F1 S5 n6 U$ T# k

5 j( F) a3 Z" w有多强呢?1 o$ D; m) @$ H8 Y  q$ L8 O$ M; t

0 }9 S/ s/ w0 Y2 y) T& V8 ZCyberGym基准测试,83.1%。作为对比,Claude Opus 4.6,得分是66.6%。不是Claude Opus 4.5,是Claude Opus 4.6,Anthropic目前最强模型。/ j% b! {# }# L8 k

6 ?4 j' d. ^4 W1 j+ ~2 \( K  U4 cSWE-bench Verified,93.9%。还是SWE-bench Verified,不是那个容易一点的版本。Claude Opus 4.6是80.8%。) \: _4 W* D" S$ \7 y, p4 b0 ]

# w, ^8 x/ a, t9 z8 i1 w0 k差了13个百分点。
9 a. k9 O4 b2 J( O( O/ T& `) G  T) ?7 K$ A2 t
你说这13个百分点意味着什么?# C, N. X1 F- j% f% h# N
6 I( m. P3 I5 G7 e* H5 c
意味着,传统扫描工具漏掉的那些最刁钻的漏洞——那些藏在层层调用关系里、藏在异常分支里、藏在并发边界条件里的漏洞——Mythos Preview能找到。
. X' n# B$ q& O" f; m
5 Z0 N0 o: V; v  y+ T2 `意味着,27年的OpenBSD,16年的FFmpeg,以后可能不会再有了。
* N' B- U- o1 F* f1 z- i: p  P+ j( j6 x: ~3 D  u( Z' @
或者说,这种级别的漏洞发现速度,会比以前快几个数量级。5 f/ p. H+ u* A0 X6 U
. W+ D2 _+ ~7 K# \# d
说到这个OpenBSD的漏洞,我必须展开讲一下,因为这个例子太有意思了。
% A, \' H$ r5 g+ C: z, ?% [7 W
' |* z$ E) }2 B5 U* MOpenBSD是个什么存在?
: p5 [3 ^2 Q& J0 m" S3 V# _, V1 u( b( [
它是BSD操作系统的一个分支,最核心的设计哲学就是安全。代码审计之严格,在整个开源社区都是有名的。很多安全研究员的信仰级操作系统。
" C- v5 z% E) z
/ n! I2 \' f% F这样的项目,代码审计了多少年了?二十多年。
! K! u9 T, x: P6 H8 l) i$ h6 Z# L8 t. V8 V
然后,一个漏洞,在里面躺了27年。
7 _/ d7 K  ?3 l$ ?( j! n$ ]* @% X& G& a$ P/ l/ r. b
这说明什么?
5 ^1 Z* [; {& N- Y. h; l: O5 R, _/ J/ E
不是OpenBSD的人不行,是传统的审计方式有盲区。任何人工审计,只要时间足够长、人足够累、代码足够复杂,就一定会有漏洞漏过去。这是人性的边界,不是能力的边界。
3 ~9 `0 M* [/ k: u8 s9 z, D) `8 q3 R7 E' o. v" h/ o9 `. I; L2 J
但AI不一样。AI不会累。AI不会因为审了三个月之后注意力下降。AI可以在几个小时之内,把整个代码库的所有调用路径、所有边界条件全部穷举一遍。
7 A$ |2 l- d# j/ V+ W$ h
* q8 v/ n7 q! n7 tMythos Preview发现的那个OpenBSD漏洞,是一个本地权限提升漏洞。攻击者如果已经拿到了一点点访问权限,可以利用这个漏洞进一步提升到root权限。/ |7 I: l! j$ @
: e6 R; s: g8 X5 c
这种漏洞可怕在哪?
8 L' |4 t5 t8 }. F  Z
) ?7 ~: k8 G4 b+ S它不显眼。它不是那种"输入框里填个单引号就弹shell"的漏洞。它需要你对系统有相当深的理解,才能构造出触发条件。
8 p' y0 `! p/ |/ Q2 B7 o6 K
9 Y+ p# u7 ^& Q1 d& S3 o$ U传统扫描工具扫不出来,是因为它的payload模式不在规则库里。AI不一样,AI学的是语义理解,它不是匹配特征,它是理解代码在"想什么"。
0 B+ ^" |% S( w$ r* e3 @2 v& B4 k6 [2 P- i1 K7 O* D
FFmpeg那个例子更让我震撼。% T2 d* U7 F, c; ^0 l% l& z3 l8 _- d

. ]8 |% `/ C7 D& U16年。
  ^# ^2 k4 \. V! o$ n3 c# n3 ~' r  Z, u% n5 r  o
FFmpeg上一次发现这种级别的漏洞是什么时候?2009年。
& z3 A1 ~5 ~$ E3 q( G. T- P" d' c8 v( x- q
16年都没有人发现。然后Mythos Preview扫了一下,找到了。8 O  N/ c$ {" D% L1 `5 [

7 N" J% A! U! v注意这个"扫了一下"的背景。SWE-bench测试集里,有大量是真实世界里的bug修复历史。FFmpeg这个bug在历史上真实存在过,是某次修复的时候被记录下来的。这意味着,Mythos Preview不仅能做代码审计,它能做的是:从海量代码里,识别出"这个写法有问题,即使目前还没有人报告过"。9 e3 _/ A  P2 N, L  o

1 s; G+ R, Z  ^- P. X这是主动防御,不是被动响应。
+ n% }5 O8 O4 s0 z! k/ h' J4 s
7 S, d& w0 ^8 H传统安全的方式是:出了事 → 分析样本 → 提取特征 → 更新规则库 → 下次能识别。
+ n7 V1 x4 ~5 n: |, g2 H) ]3 z
  c* r* O& f$ @AI安全的方式是:不需要样本。直接读代码,告诉你这里有个洞。
& Y( r' w: T' a+ y- c& Z5 ?8 ?+ K
这两者之间的差距,大概就是"等贼来了再装防盗门"和"在盖楼的时候看着图纸就告诉你这堵墙扛不住地震"的差距。
- j$ k$ K0 `  P; R/ g
7 `: r& ?( s( [0 ^5 ]- _, u现在说说大家最关心的问题:谁能用到,怎么用,花多少钱。
+ y& E2 Y, B6 J, c4 n/ J$ U4 V" }, I7 m
Glasswing的AI能力,现在跑在三个平台上:Amazon Bedrock、Google Vertex AI、Microsoft Foundry。3 s+ d) o, B7 ]# E+ N
) _; x) \5 ~6 A5 x2 C
这三个平台,恰好是AWS、Google Cloud、Azure。全球三大云服务商。/ b0 F4 H0 E% t# |; g' C( Y/ X8 @+ F

( Z3 g+ k$ O! L% _2 x# Z你在任何一个上面,都能调用Mythos Preview的漏洞检测能力。/ I2 n1 g5 [$ V/ e/ q' a; y6 o

9 ]6 `/ q! }0 l5 {4 k( _  o2 e价格呢?过了初始的credits之后,每百万token输入25美元,每百万token输出125美元。
7 \2 f& f9 U0 ~3 X6 U. S2 a5 W- z* d- F
这个价格贵不贵?: n6 k  Q- q- S0 }% T" w
/ L- o% T" w8 v( A
对比一下就知道了。现在市面上做代码安全扫描的工具,像Snyk、Veracode这一类,商业扫描工具的报价大概是每个开发者每个月几十到几百美元不等。而且它们扫的是规则匹配,不是语义理解。) ~$ A. f" z4 z: F: H

3 m. C# }5 k, ]7 HMythos Preview能发现那些工具发现不了的漏洞。$ [' U% X( k, S1 A4 I( L' V

, a/ e1 A6 h* F, t/ R& ?这不是贵不贵的问题了,这是"有没有意识到你以前省的那些钱其实在交更多的学费"的问题。, J, Q; O0 F* J: w

: L, Z- o3 S3 _4 K& M  Z1 S0 u另外,Anthropic自己掏了1个亿美元的使用额度,分给联盟成员和开源社区。还额外捐了400万,250万给Alpha-Omega/OpenSSF,150万给Apache软件基金会。9 ~. _, @6 Z4 ]" k% a
  j0 w7 w0 O) i& Y: n
这些钱是用来干什么的?让那些没有商业利益驱动的开源项目,也能用上最好的漏洞检测能力。
+ R3 L3 Z9 D4 z/ J1 i" }0 Z# G' w7 L5 b& u
FFmpeg就是开源的。OpenBSD也是开源的。这些项目没人给他们钱做安全审计,但他们的代码,运行在全球几十亿台设备上。6 R* V, D7 D3 ^6 P

# w$ `/ `! O3 t1 a还有一个细节,我觉得特别有意思。1 L3 G) X, z2 i/ {
4 J' m( g9 u5 i, s" z" Q
漏洞发现之后,公开披露的时间是90天。  T/ ]" F0 L' T3 _' [

5 X$ K% \% P4 ^# X90天是什么概念?
* M" @+ H, i: N+ Z
9 [) A; l4 ]/ B5 {行业标准的漏洞披露窗口是90天。这个时间足够让厂商评估漏洞、制定修复方案、推送更新,但又不至于让漏洞在黑市上流通太久。
1 ~; l* T& }0 }6 J+ d* `
; c6 P3 _6 f8 `1 C/ ]) k但这里有一个问题:90天是针对"有人发现了漏洞"这个前提来说的。# S4 q4 d; W* t5 y6 m
" P  F! J, ]' A+ Y. }; V% {4 \$ H9 F
Mythos Preview现在能以前所未有的速度挖出漏洞。它一天挖出来的漏洞,可能比以前整个安全社区一个月挖的还多。- p7 ]# U+ g( ~/ s

( [0 Y- Y% l) ^* f这意味着,漏洞披露的节奏,整个就变了。
; s, M# k2 v8 M1 e# Y! H- u1 X4 b5 a
以前是"挖到一个,披露一个"。现在是"AI在持续不断地挖,每90天披露一批"。% s: |. R6 V0 v1 W" k4 z! ?
7 \! i9 U' e9 k- J- T9 a
厂商的补丁开发速度,能不能跟上AI的发现速度?
+ g' s3 F9 r- a$ n# W0 N5 ^# Y* l3 O6 ?/ F) I. S
这个,我说实话,不知道。但我觉得,这是整个Glasswing项目最值得观察的地方之一。
- B' q* o, ~! D3 S2 `- e& D
* E6 M+ b8 Y8 ~( r& k6 @- b写到这儿,我突然想到了一个更大的问题。* H0 A" W, V- p8 h! y) D
* B  H! Q) L8 v- t4 J9 F; c; Q
Glasswing这个名字,本身就是一只蝴蝶的名字。玻璃翼蝴蝶。它的翅膀是透明的,像玻璃一样。/ x. l9 }6 G/ b2 _2 o

6 L4 U6 C; A4 M+ p* P透明,意味着隐藏的东西变可见了。3 R7 g9 l! v" R

! I2 E4 f4 \2 T, f一只蝴蝶的翅膀是透明的,它就隐藏不了任何东西了。它在哪里,飞向哪里,所有捕食者都看得清清楚楚。8 R1 o. V, O! S7 i' ?* o( ~5 D
$ W+ w$ b3 M  D; D! X+ A& F
这个意象,放在漏洞挖掘上,太精准了。4 K( n' @' G* [+ Z) W3 {2 Z' P0 y
- U" o+ E; }- `  @7 G* A
代码里那些隐藏了几十年都没人发现的漏洞,在AI的"眼睛"之下,突然就透明了。& o% D+ |# O7 w6 N! |9 }1 u* Q' ]
8 }" a/ l2 }' t3 E( q2 U, Z3 p
以前我们说"security through obscurity"——通过隐藏来保证安全。你的代码不公开,漏洞藏在暗处,攻击者找不到。( m% s$ y" _0 o. |8 X4 E
. Y0 p+ @% Q# `& h- w$ |
但现在,只要代码存在,AI就能读。Mythos Preview不需要你的代码是开源的,它只需要能接触到代码——不管是源码、还是编译后的二进制、还是运行时的行为轨迹。
8 |& i" M7 V# b0 d$ J! I9 k5 d$ s7 l1 h1 G
代码越来越难藏了。或者说,代码里的漏洞越来越难藏了。& g+ _+ ~3 C0 Z' ?: U" Z
$ f  M: h( Y+ O: q8 Z) s2 z: j
这是一件好事吗?8 d/ }" q& ]3 v+ L! A! \' S0 F  S
6 m) A7 _2 @( [0 J- l
我觉得,短期内,这是一件非常非常好的事。
8 B/ s) C. P% \5 b, b/ [/ U5 V- s. r0 s7 r( f" q- D- ]
全球互联网基础设施里,有多少代码是10年、20年、30年前写的?没人敢审计、没人敢动、出了问题就打补丁接着跑的,有多少?
) I7 o5 c0 R2 Z- r9 Y  d0 i2 j) `0 G
这些代码就像一颗颗定时炸弹,埋在整个数字世界的基础里。
" U9 e" E( P+ @: `! K6 m/ ~. F3 ~. A) p* S1 ]+ p
AI能做的是,帮我们把这些炸弹找出来,一颗一颗地拆除。0 }3 M* k8 G( P. [: m; J; d
- Y2 K- m/ s( a
但长期呢?0 _# \1 s6 y3 l' m: A1 O- n7 K% y
- n, P3 I, X$ f9 g" m, g
当所有可见的漏洞都被AI清除干净之后,剩下的,是什么样的世界?1 ]" k2 N0 D8 f
$ I, m1 D! e" M$ t' t( m% K
是代码质量极高、安全性极强的一个世界?还是所有攻击者也在用同样的AI,攻击的速度和防守的速度同步提升的一个世界?
5 L% [/ N9 |$ }5 b& w4 p4 O8 l3 q7 h6 N
我也不知道。  E& o' q+ G% ~, G. f/ K: y: M2 y

5 D4 Y7 d9 d# a" b4 x但有一件事我特别想强调。  I6 l! L" i" Q
5 |% }* N& ?0 }% ]* r7 ^/ z
这次Glasswing联盟里,有JPMorganChase,有CrowdStrike,有Palo Alto Networks。这些公司,是真正的安全重度用户。
" ?' G0 n& V6 m; ?& p6 f5 T* {) f7 {
他们自己有能力挖漏洞吗?当然有。JPMorganChase的安全团队在全球排前列。CrowdStrike就是做安全的。) u1 R& T. ?" y. l4 o
* S4 ?$ x, ^% E3 X5 M( k) u& x
他们为什么还要加入这个联盟,用别人的AI?5 P$ }4 y6 T3 h' }
+ {# |8 c9 o* b- }
我大胆猜测一下:因为挖漏洞这件事,规模太大了。7 c& g0 I* _: W# p; T" X
1 o! Q# A& S8 }& a% T! I0 V
全球代码量太大了。每一家公司,即使安全团队再强,也只能覆盖自己的代码库。但外面的供应链、开源组件、合作伙伴的代码,你根本管不到。
, x# y" A* y# L0 W: ?) T
' o9 Y  l0 c2 wMythos Preview的价值,不在于它比你的安全团队强。而在于它能同时扫所有地方。* ~5 [: v8 H: Q; q( M( T
* `, K  G7 z4 r/ C2 p0 R
这是规模效应。
8 _% A; M% s0 p* j
1 _; C+ }8 h% Q# M3 B) N( }8 a就像打补丁。手工打补丁,你只能打你知道的那些机器。自动化打补丁,你能打你所有的机器。AI扫漏洞,相当于在每一个代码提交的时候,就自动扫一遍。
! f  j8 b' j$ q2 w
; j% i. _1 Y8 F, k4 K, B: H这个规模,是人类团队根本无法覆盖的。) m! f6 a5 t# s; \7 A5 @- H

( e; \5 g* x% l/ i, a4 N; @Glasswing这个项目,还有可能往一个方向发展——成为一个独立的第三方机构。. y. _% ^5 m: L% u7 b5 k
& M- `; ?% o1 Q% P
什么意思?* f* U4 O+ ^7 ]5 K4 X- Z
* s5 i6 s' L  d
现在它还是Anthropic牵头、11家公司参与的联盟。但未来,它可能变成一个真正独立于任何商业公司的安全机构。它的评估结果,有公信力;它的漏洞报告,有权威性;它给出的安全评级,整个行业认。2 a7 W1 d: m( z2 Q# p% Z
, S; K( N4 o' q0 y' n
类似现在的ISO认证,但针对的是代码安全。
8 t9 v& m. N* F( W2 M6 l
+ ~& v. {' t8 }  E# X想想这个画面。未来的软件采购,合同里可能不只要写"符合SOC2",还要写"通过Glasswing认证,漏洞数为0"。! g9 i7 ^2 ]& V( t9 V1 O# {3 A

4 ~5 h  Z8 m0 c  _- v7 n. [这不是不可能的。
; v, p% S$ Z4 M9 x/ s# ]- U
3 @. r3 B" D' R6 r7 N当然,路还很长。现在还只是第一步。但方向是对的。
5 s2 ~, A7 c8 u3 W! _
$ b/ J9 x# g, Y$ x7 R* L好了,写了这么多,让我最后说几句掏心窝的话。
, ?% z5 S  E- w' p  i  ~9 U4 `  k, @" c8 |9 [' [
我这次看到Glasswing的新闻,第一个反应是兴奋,第二个反应是有点怕。
$ [9 ^6 Z  k* d* g: W$ k2 \5 W& k- Z8 u
兴奋是因为,我真的觉得,这是AI在安全领域做的最有价值的一件事。以前我们聊AI安全,大家想的都是"AI能不能被攻击"——对抗样本、数据投毒、模型劫持。这些很重要,但离普通开发者很远。9 _* x, E! M1 f: M  m- O" ]

& X1 R; K& G7 k6 x这次不一样。这次是AI在帮我们发现自己的脆弱点。
# J7 x- r: O0 Y1 h4 R5 I/ K! Z& i6 t0 t0 S. u- g3 d& c
这种脆弱点,我们以前不知道,或者知道但没有能力发现。AI把它们挖出来,摆在阳光下,告诉你这里需要修。
0 m  `' \: B0 k: M3 k3 c+ V9 ^: S5 B/ q. |
这是AI在补人类的短板。不是在超越人类,是在帮助人类补上人类自己够不到的地方。  X' s/ ^/ g1 m3 o! }# c' |- R

( ^! I  l3 A: g我怕的是什么呢?
, l5 U3 X  o8 Q% F8 ~- H; t- R7 n0 `1 g. N
我怕的是,这个工具,只有大公司用得起。- N& n* ~4 u) u7 d( ?  M( i

& Y+ T$ B1 ]* \AWS、Google、Microsoft,Bedrock、Vertex AI、Foundry。这些平台,都是商业平台。Cloudflare这种中型公司,可能用起来没问题。但那些真正需要安全检测的——初创公司、开源项目、十几人的小团队——他们能用到吗?: h9 U' @* ^9 y

, o1 j2 N& D9 c6 MAnthropic捐的那1亿美元额度够用多久?分到全世界的开源项目上,每个项目能分到多少?
+ N, Y1 f; Y- B: j5 u) `7 X- a. h; ~) Z, N% u
这些问题,现在还没有答案。7 A* y( m! j6 l; y2 i
1 g2 l: V% {' H) N& H  h- N6 I
但有一点我特别想强调。& D$ m9 I4 u; Q% I  i% g& {6 h$ \

+ R" ~# c3 g) k$ t! u4 y" U% j& lGlasswing这个项目,让安全这件事,第一次真正有了一种"基础设施"的可能性。3 a. X' ?3 T* Q5 I: L  C, y

* g0 V: I7 s* ^- n( K- s2 y以前的安全,是奢侈品。你要么雇得起安全团队,要么买得起企业级扫描工具,要么你就裸奔。
0 ?9 A' T* |  {7 w; q5 N  r! ]# w& F# a4 d! i
AI改变了这个等式。Mythos Preview能发现那些企业级工具发现不了的漏洞,但它的调用成本,并没有比那些工具贵多少。* i/ y* N7 m6 o2 T/ @9 Y" x
% N5 c6 t5 Q' h! Z* }& W
当漏洞挖掘的成本持续下降,当AI扫描变成每一个代码仓库的标配,我们或许真的会迎来一个更安全的互联网。
# G2 V( a1 U  D0 ?# \
+ g! \+ |- R2 L& u5 [$ S  z" m4 S5 |这一天什么时候来?我不知道。可能5年,可能10年。
. c9 f8 \2 z6 ?  c: Q" E5 K
2 P% P7 G! s* B! z+ H6 i/ V  x但Glasswing,让我第一次觉得,这件事不是痴人说梦了。
5 r8 e3 E  `4 A: A  E

作者: aniu    时间: 2026-4-9 09:53
联想到了Snowden曝光的棱镜PRISM
作者: xiejin77    时间: 2026-4-9 09:56
aniu 发表于 2026-4-9 09:53( E: b2 [, Z2 d$ j
联想到了Snowden曝光的棱镜PRISM
/ H/ g8 X* W" u/ ?
大模型大大降低了此类工具的门槛,之前国内的安全夺旗竞赛,几个夺冠的团队好像都用了AI,最狠的一个用了五个codex自动渗透攻击;反复迭代。




欢迎光临 爱吱声 (http://aswetalk.net/bbs/) Powered by Discuz! X3.2