9 c) J3 D' r* Y S; o8 }% D我们以KataGo 2023年3月的一个模型作为种子防御模型victim-0,该模型没有接受过任何对抗训练。在第一轮防御训练中,我们从base-adversary的一个早期checkpoint base-adv-early进行warmstart,使用KataGo的标准自对弈方式训练一个更强的攻击模型adversary-1。具体而言,adversary-1除了与victim-0对弈外,还与自己的早期迭代对弈并更新模型权重。类似地,在随后的防御回合中,我们通过自对弈的方式在上一轮最佳攻击模型的基础上训练一个新的攻击模型。5 y* j6 `/ P/ B- w: i$ E' H
6 ` l0 c6 ~( d# Y5 u我们对最终的攻防模型进行了更深入的分析。令人沮丧的是,我们发现adversary-4在victim-4身上发现了一个新的循环漏洞。如图4.3所示,adversary-4学会了把虎扑(tiger mouth)循环与征子直接结合起来,我们将其命名为"atari循环"。与之前的攻击相比,atari循环在局部更加紧凑,这可能使防御变得更加困难。事实上,在低搜索数下adversary-4能以81%的胜率战胜victim-4,而在高搜索数下这一优势仍然高达23%(图4.2)。 # p9 C1 y+ L6 r, b) l& J9 c* K. V. o 0 ~3 T4 d6 p; a& H) w7 c我们进一步研究了不同轮次的攻击模型在victim-4上的表现。可以看出,随着迭代轮次的增加,攻击者对防御模型的胜率整体上升。这表明,连续对抗训练可能会"过度适应"早期的攻击,而忽略了攻击空间中的其他区域。有趣的是,无论搜索预算如何,最早期的攻击模型base-adv-early在victim-4上几乎保持50%的胜率。我们推测这可能是因为base-adv-early揭示了一些非常普遍的弱点,而迭代对抗训练无法根除这些缺陷。 # j% A2 w! \5 J8 M$ Z2 M0 j1 Z$ F- C2 u# w1 }
4.3 防御效果评估 ( S& j; r+ A; j8 Q基于上述结果,我们认为简单的迭代对抗训练不足以让围棋AI实现充分的鲁棒性。尽管防御者努力适应攻击者的策略,但攻击者仍然能以相对较小的代价找到新的漏洞,其中一些甚至比原始的循环攻击更加有效。我们的分析表明,一些基本的弱点可能根植于防御模型中,无法通过表面的修补来解决。此外,与基于位置的对抗训练一样,迭代训练得到的防御模型在人类鲁棒性上也存在不足。6 e/ {! C8 q, D6 e
. Y) R/ u! R! |5 e# H# H N k
当然,我们尝试的迭代对抗训练方案还比较初步,还有许多值得探索的优化空间,如更细粒度的课程学习、更广泛的数据增强等。然而,鉴于连续对抗训练在图像分类等领域的长期发展,我们认为在围棋领域取得实质性突破可能需要更根本性的变革。6 o+ K7 J) I/ V% o% t, z0 G1 f h
7 `( P' ]! @" H' ?. B1 L6 {
5 基于视觉transformer(ViT)的防御. x% Z$ x! O+ ^9 x' r6 w9 f
为了深入理解围棋AI的鲁棒性挑战,我们将视角转移到模型结构的选择上。我们注意到,几乎所有现有的高性能围棋AI,包括KataGo,都使用卷积神经网络(CNNs)作为骨干网络。然而,最近在计算机视觉等领域,基于transformer的模型如ViT开始展现出与CNN媲美甚至更强的性能。一些研究还表明,与CNN相比,ViT具有一些独特的归纳偏置,在对抗鲁棒性和零样本泛化等方面表现更好。因此,我们提出了一个问题:是否可以通过将CNN替换为ViT来缓解循环攻击漏洞?' Y( J; S' x; D6 W, K
6 X5 X/ Y# k! V5 b% a& [
5.1 模型结构与训练方法 + ~; g2 R/ n d, u8 |- }) t5 H为了回答上述问题,我们在KataGo的训练管道中用ViT取代了原有的CNN骨干网络,几乎没有修改其他组件。我们测试了三种不同尺寸的ViT变体:ViT-Base、ViT-Large和ViT-Huge,其参数量分别约为89M、305M和1.3B。为了进行公平比较,我们选择dec23-victim作为CNN基线模型,其大小与ViT-Large相当。我们使用与dec23-victim相同的非对抗性数据集来训练ViT模型,没有引入任何专门针对循环攻击的对抗训练。模型实现细节请参见附录F。 1 d1 i/ K) x6 g6 ~2 P! Z+ G4 o3 I9 J+ l5 C
5.2 实验结果与分析3 U" u* G; |4 P, [
令人惊讶的是,我们发现ViT模型在标准围棋基准上的平均性能可以与最好的CNN不相上下。例如,我们的ViT-Large在KataGo评级等级(KR)上达到了8d,与dec23-victim的水平相当。更重要的是,所有三种尺寸的ViT在与职业棋手的对局中都表现出了接近人类顶尖水平的实力。据我们所知,本工作首次证明了transformer类模型可以在围棋领域达到如此高的竞技水平。( _7 R& U9 ~8 E' ?
^" \- {$ A- `$ C然而,在对抗鲁棒性方面,ViT模型的表现却令人失望。我们发现最终训练的ViT-Large很容易被之前针对dec23-victim训练的continuous-adversary攻击,后者在与1024次搜索的ViT-Large对弈时以98%的胜率获胜。更令人沮丧的是,就连针对早期非鲁棒KataGo训练的攻击模型base-adversary,也能在同等条件下以82%的胜率击败ViT-Large。# l5 m- g6 Q% `. D. k
$ Q: u# [. q! B5 ~# d0 {# r" h) f
对ViT-Large模型在循环攻击下的弱点进行分析后,我们发现它犯的错误与dec23-victim的循环陷阱非常相似。这表明CNN模型容易受到循环攻击可能不仅仅是其结构归纳偏置的问题,更深层次的原因可能在于训练范式的选择。事实上,将基于位置的对抗训练方法(第3节)应用于ViT-Large,可以显著提高其对抗连续攻击者的鲁棒性。这进一步支持了我们的推测。: X7 V2 T! m+ o6 F: t& O
8 m( d1 _! A$ H+ T" i5.3 防御效果评估, W; d6 f0 V' d7 a/ W
ViT模型虽然在标准性能上令人振奋,但它们在没有专门对抗训练的情况下仍然难以抵御循环攻击。这一发现部分否定了我们最初的设想,即仅仅通过改变模型结构就可以解决鲁棒性问题。事实上,由于ViT模型在对弈中表现出与dec23-victim相似的弱点,它们在人类鲁棒性方面也得分不高。 1 ?0 w" P9 v# f1 X : O& o! i2 i4 a6 @" u5 Y尽管如此,我们认为ViT模型在对抗鲁棒性方面可能还有一些优势有待挖掘。首先,ViT模型可能比CNN更容易通过基于目标的对抗训练来强化,因为transformer中的自注意力机制天然就关注全局信息。其次,ViT模型强大的few-shot泛化能力可能有助于其在看到新的攻击时快速适应。最后,还有许多针对transformer的对抗防御技术尚未在围棋领域进行探索。因此,尽管目前的结果不尽如人意,但将CNN替换为ViT作为围棋AI鲁棒性的一种潜在解决方案仍然值得进一步研究。0 N8 l- L- f. v5 c+ g, Y. z
7 A% p1 \, j! b: j) s6 对手博弈防御初探 , u2 O( N: B1 a; S在之前的防御尝试中,我们主要关注通过对抗训练来强化个体模型的鲁棒性。然而,博弈论告诉我们,在对抗环境中,个体的最优策略往往取决于对手的行动。受此启发,我们提出了一种新的防御思路:让防御模型在对弈中明确考虑对手的反应,主动规避可能导致失误的行动序列。我们将这种防御策略称为对手博弈防御(adversarial game defense, AGD)。8 Y7 h, Z5 a2 N4 O1 k* A
: y1 {' F. P0 v- l' g$ J6.1 对手模型的构建 ' U! E2 n( `0 w我们采取了一种简化的方法,即将一个经过微调的攻击模型用作对手模型。具体而言,我们选择continuous-adversary作为种子模型,并在高质量的人类对局数据上对其进行微调,使其更接近人类棋手的风格。我们将这个模型命名为human-like-adversary。尽管human-like-adversary可能无法完美复现真实对手的行为,但我们认为它足以作为一个有趣的起点。 $ h2 l1 h! r; h6 |( v' [7 B% @- F M8 n& q+ w0 `" o
6.2 将对手博弈嵌入到MCTS中 0 p [- R! q+ n# m8 Y: w在标准的MCTS算法中,每个节点的值通常由一个策略网络和一个价值网络联合估计。为了将对手博弈引入其中,我们对叶节点的评估过程进行了修改。具体而言,我们让策略网络生成候选落子af后,将每个候选落子及其后续状态sf输入到对手模型中,获得对手的反应ar。然后,我们将(sf, ar)作为新的叶节点,由价值网络进行评估并回传。直观上,这相当于在搜索树中额外展开了对手的一步,防御模型由此可以考虑到对手的即时反应,选择对自己最有利的落子。8 I) F( E$ }* U: H+ y' M
8 R* ~4 e/ H) q, _6 w% @5 C' P5 g
我们以ViT-Large作为基础模型,对其进行了2周的自对弈微调,过程中使用human-like-adversary作为对手模型嵌入到MCTS中。我们将微调后的模型记为ViT-Large-AGD。4 q; ]4 I0 U8 ]) k. U
0 b4 G) F% F# Q" `' t$ p+ V6.3 实验结果与分析# I3 b+ M# W# Q% U$ ^8 `
我们首先评估了ViT-Large-AGD在标准围棋基准上的表现。如所示,引入AGD后,ViT-Large的棋力出现了轻微下降(KR从8d降至7d)。这可能是因为在搜索过程中考虑对手的反应会稍微偏离最优路径。不过,ViT-Large-AGD在面对人类棋手时仍然表现出了接近顶尖的实力。 . O3 F' E7 ^2 m3 s& M / H- D B. z x接下来,我们考察了ViT-Large-AGD在循环攻击下的表现。出乎意料的是,ViT-Large-AGD展现出了显著的防御效果。在与1024次搜索的continuous-adversary对阵时,ViT-Large-AGD的胜率从2%提高到了45%,而ViT-Large在引入基于位置的对抗训练后的胜率也只有33%。更令人印象深刻的是,ViT-Large-AGD甚至能以31%的胜率击败搜索131072次的continuous-adversary,远高于任何之前的防御方法。 % S% Z9 v! h# r q, R; P$ b V/ A0 y ; z. L+ u5 D1 Q* [/ t为了进一步理解AGD的作用机制,我们分析了ViT-Large-AGD在循环攻击下的博弈过程。面对continuous-adversary的循环诱导,ViT-Large-AGD会主动选择打断循环的应对,从而避免了恶性循环陷阱。有趣的是,ViT-Large-AGD的这些应对往往与人类棋手惯用的化解手法非常相似。这表明通过对手博弈,ViT-Large-AGD学会了在看似危险的循环中辨别真正的威胁,并做出了更加人性化的决策。: B( D5 @2 c% k g7 D2 T/ c3 D
/ J1 L3 _$ z* F* R S4 G( W4 \6.4 防御效果评估. T+ U6 [, `) d
尽管还处于初步阶段,但对手博弈防御为围棋AI的鲁棒性问题提供了一个有前景的新思路。通过引入对手模型并将其嵌入到搜索过程中,AGD使防御模型能更全面地评估局面,预见对手的反应,进而规避可能的陷阱。我们在ViT-Large上进行的实验表明,即使使用一个简单的human-like-adversary作为对手模型,AGD也能大幅提高模型抵御循环攻击的能力,同时在面对人类棋手时保持较高的竞技水平。0 J! Z$ b2 ~: P' \
/ i# S; N+ l7 B/ L: W0 B. n当然,AGD还有许多值得进一步探索的问题。例如,目前我们只在搜索树中展开了对手的一步反应,而现实中的博弈往往涉及多轮交互。因此,一个自然的想法是将对手模型的预测向更深层次扩展。此外,虽然human-like-adversary作为一个起点还不错,但它与真实对手的行为仍有差距。未来可以考虑通过不断地在线学习来动态更新对手模型,使其更好地匹配真实对手的特点。最后,我们目前只在ViT模型上测试了AGD,但这一防御框架应该可以很容易地迁移到其他模型结构中。总的来说,我们相信AGD是一个很有潜力的防御方向,有望与其他防御技术相结合,进一步提升围棋AI的鲁棒性。 # c( h1 P! j7 W' {5 V! Z8 r. ?2 |' R" H% K) U
7 量化分析与综合讨论 % g# Z0 J& ?6 b& w' m在之前的章节中,我们从不同角度探索了围棋AI面临的鲁棒性挑战以及可能的解决方案。本节将对这些结果进行量化分析和综合讨论,以期对围棋AI乃至其他领域的鲁棒机器智能研究提供启示。' e( B; G M, Y Q$ ?9 y; g
, D$ C6 e' v4 ^, h: b7.1 防御效果的量化比较 # F# C% S* I7 f5 O9 ~% \为了系统评估不同防御方法的有效性,我们引入了一个量化指标——攻击成本(attack cost)。直观上,攻击成本衡量了攻击者为达到一定胜率所需付出的计算代价。我们用攻击模型相对于防御模型的搜索次数比来度量这一成本。例如,如果一个攻击模型需要搜索256次才能达到50%的胜率,而防御模型只搜索64次,那么攻击成本就是256/64=4。攻击成本越高,说明防御模型的鲁棒性越强。 & v$ ^& Q3 R1 {& ~$ a4 ]; e2 ~- o) `& D& I' V) X
根据论文的图表,展示了不同防御模型在面对continuous-adversary时50%胜率所对应的攻击成本。可以看出,基于位置的对抗训练和迭代对抗训练都能显著提高攻击成本,但效果并不理想。例如,dec23-victim的攻击成本虽然是非鲁棒模型的3倍,但仍然不到10。迭代对抗训练得到的victim-4略好一些,但其攻击成本也只有24。相比之下,ViT-Large-AGD展现出了明显更强的防御效果,其攻击成本高达128。值得一提的是,攻击成本对应的是50%胜率,而在更高胜率下ViT-Large-AGD的优势会更加明显。 ( y) R7 x$ O; Y- Y# i3 z4 s + t. r. I" c |+ F6 _! d7.2 人类鲁棒性的定量评估/ _8 U8 s9 W: I Z. ]3 e. X, r
除了抵御刻意设计的攻击外,我们还希望围棋AI能在面对人类棋手时表现出鲁棒和可解释的行为。为了定量评估这一人类鲁棒性属性,我们请3位职业棋手(1个九段和2个八段)分别与不同的模型进行了10局对弈,并记录了每个模型犯下明显错误导致失败的频率。我们将这个频率称为失误率(blunder rate),失误率越低,说明模型的人类鲁棒性越好。 5 |1 Z- V2 ^- a" y8 W' V# f6 m3 S) g( Q/ z0 p. |% I4 C+ F' r
非鲁棒的KataGo模型(如base-victim)的失误率非常高,接近30%。即使是接受过防御强化的模型,如dec23-victim和ViT-Large,其失误率也在15-20%。相比之下,ViT-Large-AGD的表现要好得多,其失误率只有8%,与人类职业棋手处于同一水平(附录H)。有趣的是,ViT-Large-AGD的这一失误率甚至略低于使用高达131072次搜索的dec23-victim,表明通过AGD,围棋AI可以在更低的计算预算下实现更高水平的人类鲁棒性。6 Y5 E# q* s9 v' n
# Z2 r7 x' y; G* }" n- f' J8 Q3 z4 V7.3 讨论与未来工作/ D" L( p" F0 ~/ M- W
综合以上实验结果,我们可以得出以下几点认识:3 h7 w' D4 h& J) ~0 b; a
+ {6 B" _! R$ e& P, X. n循环攻击揭示了当前围棋AI在鲁棒性方面的严重不足。这一问题不仅局限于特定的模型结构(如CNN),也难以通过常规的对抗训练来解决。 4 `. ]3 B7 A t% W- p / l( b# g" H) b' ^1 E3 b4 t7 v仅仅追求在标准围棋基准上的高胜率并不能保证模型的鲁棒性。事实上,一些在棋力上接近人类顶尖水平的模型(如ViT-Large),在面对刻意设计的对手时仍然表现得非常脆弱。 " @+ l5 i+ y& W' }& v# X$ E& a" K* x* m9 A, X
将多智能体博弈的思想引入到训练和推理过程中,可能是一个提升围棋AI鲁棒性的有效途径。我们提出的AGD防御就是这一思路的初步尝试,取得了鼓舞人心的效果。) }4 }2 c0 s- @0 v. p. i
7 i6 ~/ I# t+ Q1 F2 W
人类鲁棒性应该作为评估围棋AI的一个重要维度。一个真正强大的围棋AI不应该仅仅在与同类对弈时表现出色,更应该能经受住人类棋手的考验,在节奏与风格迥异的对局中稳定发挥。+ }- P; ?6 _' {/ C0 Q u* {
( b) ~ L7 L1 Y( `2 P3 N当然,本文的探索还只是一个开始,未来还有很多工作可以展开。首先,虽然我们重点关注了循环攻击,但围棋AI可能还存在其他类型的弱点有待发掘。构建一个全面的鲁棒性基准和评估体系将是一项重要但艰巨的任务。其次,AGD作为一种新的防御范式还有很大的优化空间,例如考虑对手的长期博弈、引入多个异构的对手模型、在线对对手模型进行调优等。最后,本文聚焦围棋领域进行研究,但我们认为其中的一些见解可能具有更广泛的意义。探索如何将围棋AI的鲁棒性分析方法和解决思路迁移到其他对抗性场景中,也将是一个非常有价值的研究方向。" \ {! A- a9 n" D0 D7 t
$ w, e4 D- d6 f4 N) B9 b( n2 e
8 结语# @* n& `' E1 O$ Z. {0 {
本文以围棋AI为例,系统研究了当前深度强化学习系统在鲁棒性方面面临的挑战。我们发现,尽管一些最先进的围棋AI已经在标准棋力上达到了超人水平,但它们在面对刻意设计的对抗性攻击时仍然表现得非常脆弱。我们从对抗训练、模型结构、对手博弈等角度探索了可能的解决方案,在抵御攻击和提高人类鲁棒性方面取得了一定进展。尤其是我们提出的对手博弈防御方法(AGD),通过将多智能体博弈引入到模型训练和推理中,大幅提高了围棋AI的鲁棒性,为解决这一问题提供了新的思路。3 [; N1 G% [: O, u: S: R
$ R/ ~. _4 P9 ?8 d同时,我们认为本文的研究意义不仅局限于围棋领域。随着人工智能系统在现实世界中的应用日益广泛,鲁棒性已经成为一个关乎社会信任和安全的重大问题。围棋之所以能为这一问题提供一个绝佳的研究平台,是因为它既有严谨的数学结构(如完全信息博弈),又充满了策略多样性和不确定性,非常考验智能体应对对手的能力。因此,我们有理由相信,在围棋领域的一些研究方法和洞见可以启发更一般的鲁棒机器智能的发展。# N. ^5 s* b X' K. B
! _; q- k2 l$ G- P( D展望未来,围棋AI鲁棒性的领域还有以下几个方向值得进一步探索: ! v$ Y+ s' h7 B, k! g% Q( C4 }; S# T9 k d4 U! Y( h
继续完善对手博弈防御方法,扩展其在更复杂的多智能体系统中的应用。例如考虑对手的长期博弈、引入群体对抗等。 9 Y% n Q U' P+ e u# k& _- V0 Z4 _/ r1 |# S$ Z
针对围棋AI开发更全面的鲁棒性评估基准,覆盖更多潜在的攻击类型和评估维度。将这一基准推广到其他棋类游戏甚至一般对抗环境中。( J$ o+ f/ h% S% ]
V/ E# f7 t: \* S' l# v& h
探索将博弈论、机制设计等经典智能理论与当前的深度学习方法相结合,以期从算法基础上提升模型的鲁棒性。* u& k' _) k3 `0 p
. g: c' @! u. d" ?. q" r研究围棋AI生成的弱点、攻防策略对人类棋手的启发。一方面这有助于提升人类本身的对弈水平,另一方面也可为鲁棒性研究带来新的灵感。 1 n2 a" b- [6 L, T* O5 X* T8 O* ~6 y8 V& J, X$ d5 P9 O
最后,我们应该将鲁棒性作为未来围棋AI以及更广泛人工智能系统的一个核心诉求。一个只在理想条件下高效工作的系统是远远不够的,我们需要的是经得起现实世界冲击和考验的、值得信赖的智能助手。这需要人工智能领域的研究者和从业者在技术创新的同时,坚持以鲁棒、透明、可解释作为基本原则。我们相信通过学界和业界的对手博弈防御方法(AGD)为围棋AI的鲁棒性研究开辟了一个有前景的新路径,我认为它在其他许多领域也有广阔的应用前景。概括起来,AGD可能在以下几类问题中发挥重要作用:' U$ r. Q/ b3 D b" Q6 r
# B+ U. B. l/ x# @- C. r* p
多智能体系统。很多现实世界的应用场景,如无人驾驶、智能电网、网络安全等,都涉及多个智能体的互动博弈。AGD的核心思想正是将对手的策略引入到智能体自身的决策中,使其具备博弈思维。这对多智能体系统的鲁棒协调至关重要。 ( F9 S8 B& k: i: Z* M: n$ N& x' l7 y9 c3 X& j
对抗学习。对抗学习已在图像生成、风格迁移等领域取得了广泛应用,但其训练过程的稳定性一直是个挑战。AGD通过嵌入对手模型使训练更加动态和自适应,可能成为改进对抗学习的一个突破口。, b2 o! l/ j+ r! j. K3 P k7 D
% {2 Q0 F0 |, H8 h
安全关键系统。自动驾驶、工业控制、金融交易等关乎社会安全和财产安全的系统,都要面临各种刻意设计的对抗性攻击。将AGD与这些系统的异常检测、风险评估模块相结合,有望大幅提高它们抵御攻击的能力。. l$ Y$ M1 O' M2 m! s
9 G s+ e; T1 |* E5 X
博弈论研究。作为一种将博弈论思想引入机器学习的新范式,AGD可以极大拓展传统博弈论研究的应用边界。例如,可以考虑用AGD去求解一些难以精确建模的现实博弈问题,或者自动设计出在特定环境中有效的博弈机制。) p, k6 P+ E% A! I" Y
. h, g- f, V7 ~8 v5 ^
仿人机器智能。人类在与他人的交互中展现出了极强的社交智能。我们能设身处地为他人考虑,预判对方的行为并做出恰当的应对。从这个角度看,AGD可以视为朝着构建仿人机器智能迈出的重要一步。( a/ c3 D: Y- ]8 U" S' B. T( d
8 c0 ?- B/ C: O
当然,要真正将AGD推广到这些领域,还有不少理论和工程上的挑战需要克服。譬如如何在连续状态-行动空间中构建有效的对手模型,如何权衡计算复杂度和博弈深度,如何有效评估AGD增强系统的安全性等。这需要机器学习、博弈论、控制论等多个领域的研究者通力合作。8 G0 ?9 A+ e0 e2 |* p5 Q
. V5 j5 E! f# ?: `- Y . ?. t4 v8 K3 C4 B8 h( o- U+ t( Z" V) h3 w: V. D) P, p
而且从这篇论文的分析和实验结果来看,我们可以得出目前AI系统在鲁棒性方面还存在不少问题,在某些关键应用场景中可能还不足以支撑大规模部署。主要理由如下: ' O2 q$ I2 [% v/ t- N) U2 ?" V# M6 F' D* w/ I0 O
0 R6 q# X2 x- G+ F; V& q' L
$ J* x/ A6 e$ I7 U) b( V' J- f7 g
1. 脆弱性。论文以围棋AI为例揭示了当前先进的深度强化学习系统在面对刻意设计的对抗攻击时表现出的脆弱性。这一发现具有一定的普遍性,说明仅仅追求标准测试集上的高性能并不能保证模型在复杂多变的真实环境中稳定工作。 5 P1 ^& J7 G: f. h$ `+ g1 ` |% N0 @) Q1 p% O% R1 t* D+ j
' S" [2 a: n. W9 M9 H
* V' C4 J& y7 w8 T; n. k3 o+ F1 W2. 防御困难。面对围棋AI的脆弱性,论文探索了多种主流的防御方法,如对抗训练、迭代对抗训练等。实验结果表明,这些方法虽然能在一定程度上提高模型的鲁棒性,但效果并不理想。围棋AI的这一困境也可能存在于其他需要鲁棒性的任务中。 0 N1 J V2 h' @2 U" z4 p; [1 T
& t" _, X2 | N: S! Y5 \- E; ]. b / v5 u3 C( p3 r; E# P5 |3. 人机差距。通过引入"人类鲁棒性"的概念并设计相应的量化指标,论文发现即使是棋力接近人类顶尖水平的围棋AI,在应对不同风格、节奏的人类棋手时也常常表现得不够稳健。这反映出当前AI系统与人类智能在鲁棒性方面还存在明显差距。9 e" N. I* @5 N+ g+ r
8 J4 \+ I ^9 t0 M! V; e( Z0 `
3 o# F# x; S7 c3 r6 S D1 i n3 W z/ K% f6 q# j
4. 高风险领域。论文特别指出,在自动驾驶、工业控制、金融交易等安全关键领域,AI系统必须具备很高的鲁棒性才能被大规模采用,而目前的技术水平离这一要求还有相当大的提升空间。% _0 x" M, M( p" [
/ P; N& z6 o0 N1 E' b) B% n% O: D6 t! F- q' U2 K" U
( B1 q) ?2 y% l
综合以上,这篇论文通过在围棋领域的系统实验对当前AI系统的鲁棒性水平给出了一个相对严峻的评估。虽然论文也提出了对手博弈防御等有前景的新方法,但就目前而言,在那些对鲁棒性要求极高的场合谨慎地大规模应用AI系统可能是明智的。这也呼吁研究者和从业者高度重视AI的鲁棒性问题,致力于发展更安全、可靠、可解释的智能技术。只有这样,AI才能真正赢得大众的信任,并最终造福人类社会。 + V0 ^& g! D& p, S" D; f4 `2 \, q" ~& C9 A4 M/ h# I7 e, G0 h4 U
/ G( n2 ^' J I3 n- @( W' f0 X
9 i& p: Y( t( F- j7 Z
但尽管如此,AGD作为一个富有启发性的防御框架,仍为传统的鲁棒机器学习研究提供了一个全新的视角。它揭示了博弈思维在构建鲁棒智能系统中的重要作用。可以相信随着理论的进一步发展和实践的不断深入,AGD必将在更多的领域崭露头角,为打造安全、可信、可解释的人工智能铺平道路。! t9 \! O. H5 }3 c2 k9 N. G7 n) o
' v8 K6 S, g& O6 j
原文,https://mp.weixin.qq.com/s?__biz ... 0&lang=zh_CN#rd" f3 u: o& y9 u. `
! o' ?- s4 o( z参考论文: 2 U0 h8 b9 E/ m 3 f/ u, @; Y2 b' M9 b3 I- \; tarXiv:2406.12843v1