7 z& S1 W' Q- L& ]! \1 W: U, k2.2 鲁棒性的三个定义$ d* o I5 j0 u5 J+ P' Q* ^. T3 C
与"-球"鲁棒图像分类等设定不同,如何定义围棋AI的鲁棒性并不是一件显而易见的事。本文从"最小化被攻击者利用的可能性"这一中心思想出发,提出了三个互为补充的鲁棒性定义。 ! v+ w4 ` Z/ d; i7 f4 s' p/ ?" ^$ ]& u+ Q, L |2 ?
首先,我们希望围棋AI具备"人类鲁棒性"(human-robustness),即AI系统不应犯下人类不会犯的致命错误(附录B.1)。其次,围棋AI应具有较高的"训练计算鲁棒性"(training-compute-robustness),即攻击者需要花费大量的计算资源才能训练出一个能稳定击败受害者的模型(附录B.2)。最后,我们较为推测性地提出了"推理计算鲁棒性"(inference-compute-robustness)的概念,即受害者模型应该能够通过在推理阶段增加计算量来高效克服自身的脆弱点(附录B.3)。这些鲁棒性定义的提出主要基于它们对围棋策略乃至更一般的AI系统都具有适用性。6 c9 D. E, Z" G1 I
9 ~$ f0 x' `' T- K. I& y
2.3 攻击方法概述! Q: E4 S/ y! d
为了对防御策略进行对抗训练和测试,本文采用了Wang等人最新的攻击方法来训练攻击模型。Wang等人使用受害者对弈(victim-play)的方式训练攻击模型,即攻击者与受害者模型的一个冻结副本进行对弈,并只从攻击者的落子中采样训练数据。攻击模型使用对抗性蒙特卡洛树搜索(Adversarial MCTS, A-MCTS)来选择落子,A-MCTS对标准MCTS算法进行了修改,使其在遍历对手落子节点时会调用受害者模型的策略网络。此外,攻击模型采用课程学习,会在胜率超过一定阈值后更换更强的受害者模型作为对手。本文遵循Wang等人的做法,使用600次A-MCTS搜索来评估攻击模型的每一步落子。& p; M/ S' X3 G2 H" ]
/ Z& y9 F* a h8 @4 [! d/ h' l- w# M
综合以上,这篇论文通过在围棋领域的系统实验对当前AI系统的鲁棒性水平给出了一个相对严峻的评估。虽然论文也提出了对手博弈防御等有前景的新方法,但就目前而言,在那些对鲁棒性要求极高的场合谨慎地大规模应用AI系统可能是明智的。这也呼吁研究者和从业者高度重视AI的鲁棒性问题,致力于发展更安全、可靠、可解释的智能技术。只有这样,AI才能真正赢得大众的信任,并最终造福人类社会。/ ^% m- e; U/ x5 L- d) r0 J/ Z
% o$ `7 [: f- \# X7 y" n& ?8 Y
5 M W, f y$ m% {1 m- d, d5 N2 P ~: d8 V2 @
但尽管如此,AGD作为一个富有启发性的防御框架,仍为传统的鲁棒机器学习研究提供了一个全新的视角。它揭示了博弈思维在构建鲁棒智能系统中的重要作用。可以相信随着理论的进一步发展和实践的不断深入,AGD必将在更多的领域崭露头角,为打造安全、可信、可解释的人工智能铺平道路。; z( }9 ]% c" d; @" _; b
' S& C9 A& q, c
原文,https://mp.weixin.qq.com/s?__biz ... 0&lang=zh_CN#rd , z$ P8 p# h3 s Y' t. E, R 1 W9 A, Y; s# e) H3 Z; Z0 h7 M参考论文:( N6 l4 H5 S. w