真有在人机大战前放炮的：谷歌AlphaGo是科学欺诈

燕庐敕 · 发表于 2016-3-7 18:19:23

自从谷歌改名AlphaBeta之后，她的围棋人工智能程序也就改成了AlphaGo。Go这个音是唐朝时期“棋”这个字的发音的近似，现在考证类似“国”这个音发短促些。

可见语音的变化之大。

扯远了，今天，看见人工智能学家刘锋（计算机博士，互联网进化论作者，人工智能学家主编）质疑谷歌的文章，我这里全文引用，之后在回复里面对某些段落做点评。这样是为了首先保证文章的完整性和阅读的连续性。

“把大象关进冰箱要几步”涉及的科学漏洞

　　在讨论谷歌围棋AI及其比赛问题之前，我们先看那个著名的笑话“把大象关进冰箱要几步“，2000年中国春晚，赵本山、宋丹丹的小品《钟点工》，曾经用到了这个笑话：问“把大象放进冰箱总共分几步？”答：“三步，第一步把冰箱门打开；第二步把大象放进去，第三步把冰箱门带上”。

　　小品中的情景只是一个笑话，但从科研角度看，因为故意忽视最为关键的第二步，使得这个原本伟大的科学实验，变成了笑话段子。本文提出谷歌围棋AI及其比赛有科学欺诈表现，根源也在这里。

　　谷歌围棋AI在Nature上究竟说了什么

　　谷歌在Nature发表论文阐述了其围棋AI程序AlphaGo的运行原理，这个原理描述相对专业，这里我们也力争用通俗易懂的语言描述谷歌究竟说了什么，谷歌围棋AI程序AlphaGo在下棋过程中主要通过四步完成工作，它们分别是：

　　第一步快速判断：用于快速的观察围棋的盘面，类似于人观察盘面获得的第一反应

　　第二步深度模仿：AlphaGo学习近万盘人类历史高手的棋局来进行模仿学习，用得到的经验进行判断。这个深度模仿能够根据盘面产生类似人类棋手的走法。

　　第三步自学成长：AlphaGo不断与“自己”对战，下了3000万盘棋局，总结出经验作为棋局中的评估依据。

　　第四步全局分析：利用第三步学习结果对整个盘面的赢面判断，实现从全局分析整个棋局。

　　判断欺诈的第一个原因，谷歌的把大象关冰箱问题

　　Nature论文阐述的AlphaGo基本原理，按照人工智能专家的评价：”其基本原理并没有新东西“，但核心价值是学习了近万盘人类历史高手的棋局，和自我对战下的3000万盘棋局总结的经验。

　　请注意，这个关键内容，也就是AlphaGo到底终结出什么围棋规律，或者其神经网络的权重值是什么，谷歌并没有发表出来。也就是谷歌在”大象关进冰箱要几步“问题上，说出了如何打开围棋战胜人类的冰箱大门，和如何关上围棋战胜人类的冰箱大门，但唯独在第二步围棋如何战胜人类的方法塞进冰箱，同样做了隐藏。

　　我们知道，围棋之所以很难被人工智能攻破，战胜人类高手，就是其可能的组合数异常庞大。至于多么异常，2016年1月普林斯顿的研究人员给出了最新研究结果：对于一个19x19的围棋棋盘而言，一共有361个位置，而每个位置可以单独放置黑棋、白棋或者留空，理论上所有的可能组合是3^361种。但根据围棋规则，不是所有位置都可合法落子，例如在围棋术语中没有气的位置就不能落子。那么排除掉这些不合法的棋局后总共还剩多少种呢？

　　普林斯顿的研究人员给出的19x19格围棋的精确合法棋局数：208168199381979984699478633344862770286522453884530548425639456820927419612738015378525648451698519643907259916015628128546089888314427129715319317557736620397247064840935

　　我们给它多分几行：

　　2081681993819799846

　　9947863334486277028

　　6522453884530548425

　　6394568209274196127

　　3801537852564845169

　　8519643907259916015

　　6281285460898883144

　　2712971531931755773

　　6620397247064840935

　　不用数了，一共171位数！这个数字比我们地球所有的沙粒数量还要多！比人类已知宇宙的所有星球数量还要多！对比一下，谷歌学习的近万盘人类棋局是5位数，谷歌自行对战的3000万盘是8位数。而围棋所有可能的棋局盘数是171位数。如果规避还有可能的重复变化，我们把大头去掉，那也有70位数的棋局变化。

　　第一也就是说谷歌以幼儿园规模的知识量，就要获得诺贝尔奖级的知识规律，这违背了科学发展规律和常识。

　　第二，如果谷歌通过学习和自行对战学到了超出寻常的规律，或者其神经网络权重值达到新的高度状态。但谷歌不愿意公开这个最重要最关键的内容，其他研究者就无法真正了解谷歌围棋的真实水平。在这种情况下，匆忙举办获得巨大商业利益，没有第三方真正监督，无法洗脱作弊嫌疑的世界冠军比赛。受到科学欺诈指控也属必然。

　　判断欺诈的第二个原因，密室实验与棋手放水

　　从科学实验的严谨性说，谷歌在论文中阐述的实验方法，表现不及格甚至恶劣，我们知道在物理，化学，生物，计算机等领域，进行实验时，要求实验对象必须达到一定数量，并进行多次独立实验。才能相对确保结果的稳定性和可靠性。譬如一个受到污染的试管，无论我们重复多少次实验，其结果也一定是不可靠的。

　　谷歌在这篇论文中对其他围棋程序选取了众多测试对象，并进行了495次实验，但对人类测试者，却只选取了一位曾经获得欧洲围棋冠军的棋手，并签署严格的保密协议，原本可以很容易邀请更多选手，但却没有按照科学规范进行多次实验。先不谈谷歌和棋手之间有无利益交易，就这一点，谷歌在Nature发表的论文从实验角度是不合格的。

　　更重要的问题出在与谷歌对战的欧洲围棋冠军樊麾身上，在对战棋谱公布后的二个月里，大量职业围棋高手含蓄或公开指出樊麾水平发挥失常，或不求进取，或就是放水。

　　多次战胜李世石，当前世界最优秀的围棋选手柯洁评价道：“他可能也是好久不下棋了，实力表现非常糟糕”。前北京市高校围棋冠军王烁在财新发布的文章中评价道：“这五局棋下得反而是很平庸。樊麾抵抗不足，五盘棋没有什么激烈的战斗，开局、定式、占大场、小规模接触战，收官，对抗度很差。”

　　虽然欧洲围棋冠军樊麾多次辩解“我发挥失常，当时崩溃了“，但更多棋友评价欧洲围棋冠军樊麾，“发挥有技术变形”，“樊麾的表现只有业4水准，关键地方明显放水”，“很明显樊麾是谷歌公司的托，全是50年前的招法极其保守，不输才怪”，“对于谷歌，没有什么谎言是不能用1千万美金解决的”。

　　除此之外，谷歌也没有向Facebook那样把围棋程序放到互联网上，光明磊落的接受大众的考验，作为与谷歌AlphaGo原理相同facebook围棋程序DarkForest，目前水平相当于业余5段，与职业选手依然有巨大的差距。

　　同时谷歌的论文结论也存在不可重复问题，Facebook围棋项目负责人田渊栋在评价谷歌围棋AI最为关键的快速走子策略时讲到”对此AlphaGo只提供了局部特征的数目，而没有说明特征的具体细节。我最近也实验了他们的办法，达到了25.1%的准确率和4-5微秒的走子速度，然而全系统整合下来并没有复现他们的水平。我感觉上24.2%并不能完全概括他们快速走子的棋力，因为只要走错关键的一步，局面判断就完全错误了“。

　　从上述情况看，谷歌在进行围棋实验的过程中，刻意违反科学实验规范，存在采用密室孤立实验，这些问题在3月9日与韩国选手李世石的比赛中没有消除。人们常说，互联网上，你不知道你的对面坐的是人还是条狗。同样对于谷歌围棋比赛，我们完全可以质疑，与李世石对弈的究竟是程序还是人？如何保证李世石没有被利益收买？

　　判断欺诈的第三个原因，过度追求市场影响与提高股价

　　谷歌选择欧洲围棋冠军和前围棋冠军李世石进行世界轰动的比赛，而且没有严格的第三方监督，排除作弊的可能，表明谷歌并不是追求科学的严谨和荣誉，而是在追求品牌和影响力最大化，从而获得巨大的经济利益。

　　事实也证明这一点，2016年1月28日曝出了谷歌人工智能围棋击败欧洲冠军的消息，随后是谷歌拿出100万美元作为奖金挑战李世石。当日谷歌股价大幅上涨，涨幅4.42%，换算成市值涨了200亿美元。从宣传效果是看，谷歌这次的“广告”做非常巧妙。2016年2月26日彭博社报道，谷歌旗下设计围棋AI的公司DeepMind正推进自身医疗技术发展，因为其在围棋领域的影响，已经获得不菲的订单。

　　谷歌的技术期货路径和消除欺诈指控的方法

　　西方谚语说”一个动物，如果它走起来像鸭子叫起来像鸭子它就是鸭子“，同样，对于谷歌围棋Ai及其比赛，如果它回避公开如何从3000万盘（8位数）棋局获得171位天文数字棋局的规律或神经网络权重值，回避不愿大范围邀请棋手参与实验，回避收买选手嫌疑，回避不在互联网上公开对战接受监督，那么谷歌的围棋比赛可以看作一场精心策划的科学骗局或有欺诈嫌疑。

　　商业中有一种做法叫产品期货，消费者购买商品后，要等到半年或一年后才能拿到，那时技术，原料成本大幅下降，商家因此获得利润。同样，谷歌的围棋程序应该获得一定进展，但远没有到达能够挑战职业选手或九段高手的地步，谷歌通过市场和技术手段，拔高其围棋水平。故意回避公开监督或公开大范围对战。等待未来水平继续提升后，可能会进行公开，这种做法也可以称作 ”技术期货路径。

　　谷歌可以消除欺诈指控的嫌疑，不是与李世石下棋，而是：

　　1。完整公布或开源其利用3000万盘棋局和学习人类棋谱总结的规律，或公开其神经网络权重值参数，让其他实验者可以重复谷歌的实验结果，还原谷歌对战成绩。

　　2。将谷歌围棋AI程序AlphaGo放在互联网上，接受百人，千人的同时对战。并检测对战结果，消除作弊嫌疑。

　　这两条谷歌能做出任意一条，都可以看作是消除欺诈指控的强有力证据，但在未来一年或更长时间里，谷歌没有任何动作，那么谷歌将持续背负有科学欺诈嫌疑，利用科学炒作获得巨大经济利益的指控。

一叶飞刀 · 发表于 2016-4-6 21:10:50

武工队发表于 2016-4-6 00:38
7 a5 |# J# X& [: i0 f他的意思是，作为顶级学术论文而言，重复率不够
, U/ z* x4 q4 `2 t/ E6 R1 ~
) E$ I7 _2 i- A8 G; C* C审稿的时候面对为什么实验不足这样的问题，如果回答为了 ...

他要求海测，至少要上一万台大型服务器吧，这个因为钱不够也要打回？如果没有一万台，肯定连不上啊
如果只是一个人，大概是可以的，那台机器开着就是了

武工队 · 发表于 2016-4-6 00:40:56

定风波发表于 2016-3-13 11:27, n" ?/ j$ y3 S" }- z, R7 w
你造不出宝马的概念车，那宝马就是骗子吗？什么逻辑。人家辛苦研发的东西你一句话不放出来就是偏子就骗到 ...

宝马是商品，用户那么多，试验过性能的人成千上万

武工队 · 发表于 2016-4-6 00:38:31

一叶飞刀发表于 2016-4-5 22:15
4 e: [" V! v4 _$ j# ^' c0 b如果要验证，你打算怎么验证？如果是用九段来验证，那么必须使用大型机一对一，你觉得这种机器跟PC一样省 ...

他的意思是，作为顶级学术论文而言，重复率不够

审稿的时候面对为什么实验不足这样的问题，如果回答为了省电，肯定要被打回去的

一叶飞刀 · 发表于 2016-4-5 22:15:36

本帖最后由一叶飞刀于 2016-4-5 22:19 编辑

snark 发表于 2016-3-13 22:41
8 U/ w% V+ P; l' H) S8 p自始至终都在说学术欺诈，而不是说欺诈。

如果要验证，你打算怎么验证？如果是用九段来验证，那么必须使用大型机一对一，你觉得这种机器跟PC一样省电是吧？
就算是真开了，你也会说你连不上，Google在弄虚作假——无论如何Google也不可能买上上万台大型机来做这个事。
如果是造假，买通一个李世石是不够的，因为很多九段对于第一盘，都认为是李世石领先，要么被买通了，要么Google的排局能力已经能骗过九段了，你打算采取哪种猜想呢？

snark · 发表于 2016-3-13 22:41:37

定风波发表于 2016-3-13 11:27
0 P2 S* x8 q& b% p; \8 ?你造不出宝马的概念车，那宝马就是骗子吗？什么逻辑。人家辛苦研发的东西你一句话不放出来就是偏子就骗到 ...

自始至终都在说学术欺诈，而不是说欺诈。

定风波 · 发表于 2016-3-13 11:27:34

snark 发表于 2016-3-13 05:42! t/ Y" h4 h+ G! x/ R
如果不允许别人重复那就应该给大家验证其性能的机会。7 t2 `4 \4 I6 J: z9 S" i# f, f
不然不就是骗子吗 ...

你造不出宝马的概念车，那宝马就是骗子吗？什么逻辑。人家辛苦研发的东西你一句话不放出来就是偏子就骗到手，谁傻？这个系统平移的话应用领域多着去了，我看很多关键连专利都不会去申请。

snark · 发表于 2016-3-13 09:31:56

月映空山发表于 2016-3-13 06:063 x! R& s& C3 b$ \( I
都下了三盘了，这不叫演示什么叫演示。你难道要的是源码？

除此之外，谷歌也没有向Facebook那样把围棋程序放到互联网上，光明磊落的接受大众的考验

facebook这才叫经得起大众考验。

AlphaGo两次五番棋，棋手都签保密协议，说个不好听的话，每盘棋都是预先定好的棋谱，其实啥程序都没有，就目前披露的事实看也不是完全没有可能.
这程序没公开源码，也没给其他人机会去验证AlphaGo的棋力。这不是学术的做法，但是据此在Nature发表了一篇学术论文，article，这就不得不让人怀疑了啊。
公开信息允许其他研究人员重复实验过程，或者提供条件允许其他人验证你的实验结果，在我看来是学术研究最起码的要求。这两点AlphaGo都没有做到，这才是被人质疑学术欺诈的原因。

月映空山 · 发表于 2016-3-13 06:06:52

snark 发表于 2016-3-13 05:41
7 o( C( h$ R" d: N y! I既不肯给设计图，也不肯拿实物出来演示，那就不能让人相信发动机的性能 ...

都下了三盘了，这不叫演示什么叫演示。你难道要的是源码？

snark · 发表于 2016-3-13 05:44:24

四处张望发表于 2016-3-12 14:11
9 \, a* v2 T5 Z+ e) l0 ]它的算法并不是很新鲜的东西，但是它达到的结果是里程碑性质的，作为一个文章而不是论文，不觉得有任何不 ...

作为一件新闻当然没问题，可是前面有人提到这玩意发了篇Nature的research article。
这就不合适了吧

snark · 发表于 2016-3-13 05:42:17

定风波发表于 2016-3-12 23:434 j! b- h7 i' m) W; }* K/ O+ m# s9 H
为什么要重复？技术的东西肯定不希望别人也能做出来啊，至少不能原样做出来。 ...

如果不允许别人重复那就应该给大家验证其性能的机会。
不然不就是骗子吗

snark · 发表于 2016-3-13 05:41:03

月映空山发表于 2016-3-12 21:562 e4 z3 k& l2 J+ E8 P6 A) t
晕倒，造发动机还要给设计图才有掌声啊？

既不肯给设计图，也不肯拿实物出来演示，那就不能让人相信发动机的性能

定风波 · 发表于 2016-3-12 23:43:32

snark 发表于 2016-3-12 05:327 V1 O9 |: k0 h/ C" K: T4 n' K- V( Y. u, m
我倒不是觉得一定要公开具体参数- ^5 b3 P/ G9 B2 E
而是要提供足够证据支持结论，要给出可以证伪的机会，才能让人信服，才 ...

为什么要重复？技术的东西肯定不希望别人也能做出来啊，至少不能原样做出来。

月映空山 · 发表于 2016-3-12 21:56:39

snark 发表于 2016-3-12 13:26: E9 J: F' v* P9 S8 |+ k
这和地位无关吧+ C4 ^, N+ {; T& ]7 g% E
帖子提到facebook搞的围棋程序网络公开，谁都可以挑战，公认业余五段水平。# v: \2 I. R8 m: u+ M+ q
AlphaGo之前 ...

晕倒，造发动机还要给设计图才有掌声啊？

四处张望 · 发表于 2016-3-12 14:11:00

snark 发表于 2016-3-12 13:26
+ Z. S0 z5 i( Y4 F8 |6 |; g' a这和地位无关吧
$ g: D1 W( H F帖子提到facebook搞的围棋程序网络公开，谁都可以挑战，公认业余五段水平。
, ]7 @8 L8 Z. s0 CAlphaGo之前 ...

它的算法并不是很新鲜的东西，但是它达到的结果是里程碑性质的，作为一个文章而不是论文，不觉得有任何不妥。

snark · 发表于 2016-3-12 13:26:24

四处张望发表于 2016-3-12 10:24 @1 q7 ?3 k9 m8 q6 V
那你可能不太明白围棋在人工智能领域的地位

这和地位无关吧
帖子提到facebook搞的围棋程序网络公开，谁都可以挑战，公认业余五段水平。
AlphaGo之前下赢了签署保密协议的欧洲冠军，目前在和签了保密协议的韩国棋手对弈并赢了前两局。
两相比较，你觉得这样就能客观评价AlphaGo的棋力？
正是围棋在人工智能中的地位高，才不能仅仅用两次签署保密协议的五番棋作为棋力的评判标准啊。

航空发动机作为工业桂冠最耀眼的宝石，可以和围棋在人工智能的地位相比吗？
我总不能仅仅声称造了性能卓越的发动机，既不给你看设计图也不给你实物验证性能，然后等着大家的掌声吧。我觉得帖子提出的AlphaGo的学术论文没有给出干货的说法没问题。
你可以用商业机密的理由不公开，但这样你就别扯学术的大旗

史老柒 · 发表于 2016-3-12 11:43:09

李喆：这两盘棋没人会比李世石做得更好！

李喆，围棋职业六段棋手，龙星战冠军，AlphaGo与李世石九段比赛，新浪直播解说嘉宾。

　　引言　
　　我不知道这篇文章要怎么开头。
　　没有言语能够形容我现在的心情。
　　19年前，围棋入门课，用十个棋子在中腹摆出两眼活棋。
　　4年前，挥别围棋赛场，进了大学。
　　怎么也想不到，在今天，竟然会为了一张棋谱，我哭了。
　　哭得很开心。
　　我不知道这世界上还有几人与我此时有同样的感受。或许有，绝不会多。
　　我不奢求读到此文的人都能理解我在说什么。
　　但是，我要把我看到的记下来。
　　不是纪念，而是感激。
　　我发现，在情绪中，我只能记录下我的情绪，却无法写出这情绪的由来。虽然我自认为清楚地知道它的由来。
　　写一篇抒情的文章很容易，但没有什么太大的价值。我看到的东西，这似乎应该用“美”来表示的这种东西，难以抽象成语言将它描绘。于是，我只好等到情绪消退，从理性出发，试着把因果呈现。
　　这样，会有更多人享受到这种美吗？
　　我不知道。
　　或许可以试试。
　　深夜。终于可以动笔。

　　2016年3月10日，AlphaGo对阵李世石，人机大战第二局。

　　对于这盘棋，虽然分歧远小于上一盘，但职业棋手之间仍然有许多互不相同的看法。

　　或许随着时间的前行，这些看法最终会汇流为一。但在今天，在故事发生的当下，面对经验以外的事情，人类观点的多元无法避免。我的观点同样也是这多元中的一元，正是人类思想的多元性丰富了我们的世界。

　　在敲完上面这一串字之后，我原本准备神游到中午的状态，从头梳理一遍我的所见所思，将我看到的那无法用语言直接描述的感受的由来渐次呈现。

　　然而，事实教育我们不要在写文章的时候刷微信微博新闻朋友圈……

　　一个小时之后，我不得不再次改变写法。

　　这两盘棋，没人会比李世石做得更好！

　　是的，这就是我文章的标题。

　　我知道我说服不了所有人。这样的标题也不是我一向的风格。

　　但是，在铺天盖地的对李世石的质疑声中，我必须把我看到的讲出来。

　　因为，我不相信这些质疑是出于恶意。我只能理解为有些我看到了的东西人们没有看到。每个人的认知体系不同，对待事物的态度也不尽相同，对此倒没什么好指责的。

　　在小说《冰与火之歌》之中，有一场“黑水河之战”。守方的指挥者是一个侏儒，用尽了各种策略，最后亲上战场被割掉了鼻子，终于抵挡住了对方的进攻，拯救了那座城市。但在战争结束后，他被解除了职位，甚至成为阶下囚。他所做的一切，人们并没有看到。

《冰与火之歌》电影截图《冰与火之歌》电影截图
　　没有关系，我把我看到的东西讲出来。

　　我只希望，读者能耐心看完这一章，再做判断。

　　在阅读本章之前，建议先读昨天那篇“【火线速递】——李世石的策略与AlphaGo的弱点”，会帮助理解此文。

　　0.莫须有的“协议禁劫”

　　这一节是本文最没有价值的部分，也是我最不想写的部分。谣言自破，本不需我来回应。但一方面我对谣言扩散到圈外而感到羞愧，另一方面也能帮助大家稍微理解AlphaGo的算法。

　　关于“协议禁劫”的质疑大概来自“AlphaGo七盘棋都没出现劫争”这一说法。

　　或许DeepMind会官方回应此事，或许在接下来的对局谣言自散。

　　但不需要这些证明，难道我们就不能分辨了吗？

　　由弱到强，我先给出三个回应。

　　1，懂围棋的朋友，你真的相信李世石作为一名世界顶级棋士在代表人类出战的历史时刻会签这样的协议？不懂围棋的朋友，你真的相信谷歌团队会签这种改变围棋玩法的协议？

　　2，AlphaGo的算法决定了他在不打劫就能获胜的条件下会尽量避免劫争，因为优势下的劫争增加了搜索的不确定性，常常会使他对胜率的估计降低。这也是我在上一篇里谈到的逃避劫争问题的本质。但是，非胜不可的劫，电脑必然会打。可逻辑推断或参考第3条。

　　3，难道不能去看一眼去年10月AlphaGo对樊麾的棋谱吗？第三局、第五局，都出现了劫争。其中第三局马上消劫形成转换；第五局劫争过程持续18手，亦形成转换。

　　在围棋受到空前关注的时刻，我认为圈内人有辟谣的义务，不助长谣言则是底线。

　　1.AlphaGo算法的关键特点

　　很多人说发现了AlghaGo的很多失误，不能理解这么弱的一个AI怎么能赢李世石，所以blablabla……

　　如果你看过上一篇分析仍然这么认为，那可能是我没有讲清楚。绝大多数对AlphaGo实力的错误估计，都是因为对AlphaGo算法原理的不了解。

　　强调一下：

　　AlphaGo的算法决定其落子的决策基于“胜率”而不是“最优”！

　　所有质疑AI失误的同学请记住这一点。

　　这也是这篇文章整个分析的逻辑起点。

　　这意味着，我们人类所谓的“失误”对于”AI“而言很可能不是失误。

　　2.第一局李世石在做什么？

　　第一局下完，有棋手提出”李世石心态不对，太过急躁，电脑计算力肯定强，应该慢慢下跟它拼形势判断，它的判断力肯定不行”。

　　说得好。李世石第二局就是这么做的。

　　只是，在第一局之前，几乎没有人认为李世石的乱战能力会不如电脑。

　　在上一篇中，我谈到在赛前对AlphaGo算法的分析认为，它在面对“开放性复杂局面”的时候可能会变弱，因为深度学习加蒙特卡洛的剪枝和搜索在面对开放式复杂局面时可能会变得失效。

　　第一局，李世石上来先试探了无谱布局(你说李世石没用什么策略？好吧)，然后马上导入开放式复杂局面，呈现出六七块棋纵横交错的场景。

　　结果，第一策略失败。起码下到中盘收兵为止，赛后职业棋手基本上都认为李世石亏损。

　　如果是我在场上，或许也会在第一盘选择这样的第一策略，但我只会考虑一盘棋试一个策略，毕竟有五盘棋的空间。

　　然而，李世石在中盘及时收手，第77、79手主动停战转向收空，导入细棋局面。

　　他在第一盘竟然试探了两个策略！

　　那么，你可能会问，如果李世石原本形势不利，怎么能导向细棋甚至反而领先呢？那不是说明AI出现了足以颠倒胜负的错误吗？

在昨天，对此问题我还不能完全肯定地回答，但在今天我可以确认：

　　第一局所谓李世石的领先和细棋都是人类经验带来的错觉！从开局战斗到最后结束，一直是AlphaGo优势！

　　这一判断也符合AlphaGo自己的胜率走势。

　　在上一篇，我提出AlphaGo对局面的判断是基于一手对方没有算到的严厉手段(102)，我们认为它在左上的缓手(80)和左下的恶手(86)，确实并不肯定好，但在AI看来却是最接近胜利的选择。观战棋手认为左下之后黑棋已经逆转甚至大胜，是由于

　　1) “左下白棋大亏”

　　2)对第102手没有充分的准备。

　　3)人类的傲慢自负。

　　然而，

　　1)是一个依靠经验的局部判断，并不具有能构成证明的准确性；

　　2)AlphaGo的局面判断基于有102这一手；

　　3)人类的情绪降低了判断能力。

　　102手一出，李世石长考无果，局部大亏。然而，这个大亏根本就在AlphaGo的判断之中，对它而言，这只是搜索树中可能出现的一个分支。

　　至于很多人认为后面黑右下走好还能收——确实是能收，但恐怕不能赢了。当然，跟我下或许你能赢，但对AlphaGo不行，这是从AlphaGo的算法和下法的逻辑推出来的。当然，这个结论的得出依赖于AlphaGo在对阵人类时这套方法不会出现问题。基于这两天它这套方法在对人类时还没有出现任何问题(关于失误问题请看上一章或上一篇)，我只能极大程度地相信它。这个信念只有在AlphaGo这套方法在对阵人类出现问题而败北时才会动摇，才会需要去寻找它的问题在哪里，以及人类能够怎么去利用。

　　有趣或者说可怕的是，对于人类而言无比闪耀的”胜负手”102，包含了如此多的计算、判断和预谋，对于AI而言却只是它这一局平凡的93手棋中平凡的一手。

　　这样的话，李世石的第二策略起到什么作用了呢？

　　非常大的作用。对于第一局的80和86手，我们在经验上认为它们可能是不好的棋，但无法严格证明。但对于后面的136手和142手，我们可以严格证明它们肯定劣于另一个选点。这使我们确认了AI的一个弱点，即“缺乏逻辑能力”(见上一篇)。如果再补充一条，可以认为“缺乏局部封闭搜索能力”(这一条是否算弱点可讨论)。

　　因为逻辑能力的缺乏，导致AI有时会出现人类看来明显的失误。

　　但我们认为的不可理解的失误，只是在它看来不会降低胜率的选择。确实，我们可以指出他的一些基于逻辑的可证明的局部亏损，比如无谓的绝对先手交换，比如目数的白白亏损。在对第一盘的总结中，我认为这可能会是电脑的一个弱点(对AI而言不是失误)，即“缺乏逻辑”而导致的局部小损，而这可能是人类仅有的两个突破口之一。AI在优势时会在局部有所退让以确保胜利，在均势时如果也退让岂不是人类就有了领先机会？因此我提出：

　　1，我最期待的策略是，李世石按照人类研究很深的套路开局，因为AI并不会背套路。即使不能凭此占优势，也要尽可能保持局面的均势。在这个条件下，AI或许会在一些简单的局部因逻辑缺失而有所亏损，人类牢牢把握住这些微小的利益，最终取得小胜。不过，这似乎并不是李世石常用的风格。

　　这是第一局之后我分析认为针对电脑弱点的最优策略。

　　3.第二局李世石在做什么？

　　如果是你，在第一局的下法失败之后，第二局你会怎么下？

　　我的想法是，通过第一局我意识到AI的强大可能超乎之前的想象，在我认为他最可能失败的地方他居然成功了，但好在我也看到了他可能的弱点。我根据它最可能的弱点制定了一套新的策略，然后严格按照这一策略执行。

　　这是因为，我发现可针对AI弱点执行的策略并不多，而第一局我使用两个策略失败了。我可能需要更专注于一个策略的执行，毕竟后面还有三盘的空间。这是我在第一局后会做出的决定。

　　或许有人会问：”瞧你说得这么玄乎，你又不是李世石，他又没说，你怎么证其有？”

　　是的，我不能证其有。即使他说了也不能完全证其有。我只是用棋谱信息加上AI算法来做的合理推测。当然，李世石有可能并没有制定什么第几策略。如果是这样的话，他就太天才了——别人用知识和推理达到的方案，他仅凭意识就做到了。

　　前面说了这么多，总还得用棋谱说话嘛。那么让我们看看第二局到底发生了什么。

　　我个人认为，对于这一局，传统的棋评解说意义已经不大了。

　　先看第13手。右下先虎之后脱先中国流，这又是“职业棋谱中从未出现过的布局”。看到这一步，李世石站起来，出去抽了根烟。

　　下面请允许我趁李世石出去抽烟时暂时代入他来思考。(画风突变如有不适请勿见怪)。

　　此局我下决心执行一个策略，这个策略是针对AI弱点的攻击。这个策略简单说是：”熟练开局，争优保平。细微局面，等待失误。“(原因在前面讲得很清楚了)

　　于是我开局选择了最普通的布局应对。白方这一布局在历史上经久不衰，没有千局也有几百局实战了(感兴趣可以去搜一下)。经过昨天试探，AI不会背谱，人类整体的经验很可能是最有力的，我要尽可能导入到熟悉的套路中。

　　下到12手，我心里还有一点兴奋：这个布局我是见得多了，白棋总是不亏的。

　　然后，看到对方落下黑13。

　　纳尼？

　　定式不下完？

　　这还能脱先？

　　我勒个去，AI你不会是知道我在想什么，跟我玩心理战吧？

　　啥时候通过图灵测试的？

　　好吧让我想想。你定式不下玩就脱先我得制裁你啊，夹击如何？

　　我拆1，你拆2，我攻3，你抢4……这棋失控了啊，这局面没人下过啊？

　　我这棋好不好呢？下边会攻成什么样？是否足以抵消黑上边阵势？

　　以下省略几十个脑海中飞速出现的变化图……

　　判断不清，好像没啥把握。

　　怎么办？策略就这么被破了？

　　有了！我就当右下黑棋没交换虎那一下不就行了！

　　咱谱着该走哪还走哪，机器你能怎么着？

　　哈，我咋这么机智呢？

　　AlphaGo你有我这么机智吗？

　　一盒烟正好抽完，李世石回到了座位上，落下第14手。

　　这是右下没有虎和拆一交换时最常见的下法，也不知有几百盘。而且这时黑棋虎白棋也多半会拆一。

　　好了，这个小故事告一段落。我并不是说这就一定是李世石的心理过程，而是说，如果是我，我会这么做。

　　这盘棋技术上无与伦比的精彩我想留到第二部分再谈，那里有更加精彩的新世界，但在这里暂时先略过。

　　再简单回应一下所有认为李世石后来84、146、172这三手棋没选择打劫有问题的观点。

　　1)认为李世石不选择打劫是因为签了协议的人。

　　您好，再见。

　　2)认为李世石不选择打劫实在太怂了的人：

　　如果你看完前面的分析还这么认为，那请回答：打劫能赢？

　　当然，你可以说84托虎明显优于实战，146应该夹进去才能争胜，172不冲不足以平民愤……

　　那句话怎么说来着……你以为你以为的就是你以为的吗？(这句话用来看人和AI真是金句了)

　　对AI来说，气势是什么？血性是什么？胜负感是什么？

　　AI只看：胜率是什么。

　　的确，我这不也是我以为的？

　　好吧，请告诉我托虎做劫在当时为什么比实战好，后两处哪一处你认为会对胜负产生影响？给一个有效辩护吧，不要摆几步说个看不清就赢了。

　　在我看来，这盘棋李世石完整地贯彻了他的策略。

　　可惜的是仍然并未取胜。原本预计在熟练的布局套路下能在前半盘占优或持平，然后在后半盘等待AI因逻辑缺失而造成的局部小亏损。然而，在形势接近的情况下，电脑的局部“失误”变得比第一局更小、更难确认(比如15、117等先手不保留)。

　　这可能是一件非常可怕的事情。它告诉我们，在形势接近的情况下，AI的“失误”也会变少，甚至消失(不被人发现)。AlphaGo形势越好，他的”失误”可能越多。我们基于这些”失误“对它进行棋力的判断，只会造成对它无止尽的误解。

　　还是把上一篇文章的结语在这里引用一下：

　　如果我们只用人类思考围棋的方式来理解AlphaGo，或许我们将永远都不知道是怎么输的。

　　读到这里，相信大家对AlphaGo有了更直观的认识。

　　或许有人会想到这一点：这么看来，AlphaGo岂不是遇强更强？

　　的确是！

　　它的目标只有赢，不求最优。

　　在对手弱的情况下，它可能选择的类似胜算的点就更多。

　　在对手强的情况下，它可能选择的类似胜算的点就更少。

　　后者，意味着更精确，意味着在人类思维的意义上更少失误。

　　那么，AlphaGo的极限在哪里？我不知道。

　　但我认为AlphaGo饶天下一先是指日可待的事情。

　　虽然我赛前和现在都无比希望李世石能获胜，因为人机相持的时间越长，可供围棋界反思的时间就越长。

　　但是，理智告诉我，AI真的绝尘而去了。

　　让我们回顾一下老罗的这段话：

　　“人工智能就像一列火车，它临近时你听到了轰隆隆的声音，你在不断期待着它的到来。他终于到了，一闪而过，随后便远远地把你抛在身后。”

　　围棋AI，是这段话最好的注脚。

　　看完第二盘之后所有认为AlphaGo 只是后半盘强的人，如果你能理解前面提到的知识和逻辑，那你也应该能理解这一点：

　　是李世石的强大逼出了AlphGo的后半盘。

　　为什么第一盘AI的后半盘”失误“更多？因为”失误”时AI已经胜定。

　　第二局赛后的采访中，Demis Hassabis表示程序中间一度认为形势接近(根据胜率显示)，而李世石表示自己是完败。

　　如果说第一局李世石输棋之后还有曾经领先的错觉，这一局他自己则完全没有了错觉。即使在棋界几乎公认为AlphaGo明显亏损的左下角定型之后，李世石都不觉得自己有过任何优势。正是这种正确(保守？)的认识加上前半盘相对熟练的格局，使得AlphaGo一度认为局势接近(很好奇AlphaGo有没有认为自己落后过)。这也激发出AlphaGo强劲的后半盘，在对阵世界顶尖棋士时，仅仅通过收官就将胜负差距扩大到盘面十多目。

　　对于这件事情的夸张程度，棋手们能否正视？人类面对不能理解的事物，总是用固有的知识体系来理解。但是，新时代真的来了。

　　4.李世石，直面AI的围棋英雄

　　读到这里，我希望有一部分人能够理解在李世石和AlphaGo之间究竟发生了什么。

　　这一节，我是对你们说的。

　　从古至今，我们从来不知道在围棋技术的浩瀚空间里，人类到底站在了什么位置。是离天只有三尺远？还是仍然站在地平线？

　　如果把穷尽看作天，把入门看作地，人类今天对围棋的认识究竟在什么层级？

　　藤泽秀行先生曾说：”围棋，我只知百分之五”。相信包括我在内的绝大部分棋手，都曾认为这是谦辞。往正面解，是敬畏心；往负面解，不知是什么心。

　　真的是谦辞吗？

　　纵向看不清，横向比较一下总可以吧。其他有职业体系的棋类项目，变化比围棋少很多，未知的东西少很多，那么其职业选手是不是很可能相比我们在各自体系中站在更高的层级？

　　可是，他们都早已接受了AI的层级在人类之上这一事实。

　　诚然，在不短的时间里围棋是仅存的硕果，围棋选手看着用机器训练的同事们，发出”围棋永不会被机器打败”的豪言，似乎在捍卫着什么了不得的东西。

　　并不是我想要戳破这种幻象，而是事实摆在眼前，不由你不信。

　　国际象棋遭遇深蓝挑战时，人机之间还相持了一段时间。直到今天，在国象和象棋，虽然人不能战胜AI，守和还是可能的。一方面AI的技术层级可能并没有比人类高出太多，另一方面和棋的空间是一个很大的缓冲带。

　　围棋呢？确实围棋更难于被AI攻破，可是一旦攻破，会有多少高出人类的空间？围棋AI离天还有多远？人类棋手离天又有多远？没人能给出准确的回答。

　　如果没有围棋AI，我们将永远不知道自己在围棋的天地之间究竟处于什么位置。

　　围棋AI是我们唯一的参照者。

　　虽然在围棋被穷尽之前我们仍然不能准确地定位自己究竟处在什么位置，但是，

　　我们不再孤独。

　　多年以后，围棋书上将会如何讲述这次李世石代表人类围棋最高水平与新生AI对决时做出的种种努力，又将会如何评价面对忽然之间凌驾于人类之上的围棋AI时李世石的表现，我并不能肯定。

　　我只是希望在这个连李世石的职业精神都会受到质疑的时代里，把我看到的事情告诉大家。是不是真相，请自行判断。

　　“李世石面对AlphaGo，并未因五个月之前的棋谱而有丝毫轻视，他做了非常充分的准备。他抛开人类的偏见和自负，试图理解AlphaGo运算的机理，并找出其中可能存在的弱点。在比赛伊始，他就对AlphaGo可能存在的弱点进行了直指要害的攻击，并且在失败后迅速调整，继而展开了第二次、第三次针对性攻击。正是他的策略针对性，使人们更好地理解了AlphaGo的强度和特点，以及不同于人类的决策模式。他在第二局中就已经找到了足以在中盘接近甚至抗衡AlphaGo的布局策略，使人类第一次见识到AlphaGo梦幻般的后半盘。”

　　——这是我对李世石在人机大战前两局表现的评价。

　　从这两盘来看，我不认为这个世界上还有哪一个人能够代替李世石将这件事做得更好。

　　写到这里，天已经亮了。

　　但是故事还远没有结束。

　　5.在后三盘可以做什么

　　第二盘之后，我在上一篇文章中推测得出的最优策略已经被AI强大的实力证明难以取胜。虽然这一策略在最大限度上利用了人类集体的经验，从而能够在中盘取得接近的局势，但在这种情况下AlphaGo的后半盘不是限时人类所能抵挡的。那些认为李世石发挥太差、自己上去可以不失误的选手，既低估了人性的弱点，又低估了AlphaGo的实力。

　　昨天给出的次优策略则是关于劫争：

　　2，另一个策略是在局面选择中尽可能制造劫争，即制造对方不开劫就不利的局面。当然，AlphaGo目前没展现出复杂劫争的能力并不能证明它没有这种能力，因此这种策略是存在风险的，太过刻意是不行的，还要考虑局面的自然和均衡。

　　但是在看完第二盘AlphaGo的表现之后，我认为这一策略实际上也已经破产了。AlphaGo的算法使得它只会去打那些能影响到胜负的劫争，与胜负无关的劫他就不会打了。

　　虽然如此，我觉得李世石还是会去试试。我在第一局时只看到了AlphaGo的两个弱点，第二局则基本证明这两个弱点都是人类所无法利用的。AlphaGo在尽可能避开劫争的条件下仍然能完胜李世石，这才是关于劫争方面应该关注的焦点。

　　关于弱点，李世石在第二局赛后表示，没找到AlphaGo的弱点。我认为他非常诚实，而且他确实已尽力寻找。

　　虽然我非常希望李世石在这次比赛能够获胜，为围棋行业的发展争取时间。但在我看来，后三盘在正常情况下李世石将毫无胜算。

　　空中开局是否有效？我认为无效，但或许比较有趣。

　　如果不去找bug，剩下的事情就只有——跟AI学棋。

　　6.人类如何跟AlphaGo学棋

　　这是个不小的话题，在未来一段时期内会被围棋界的人反复拿出来讨论。在这里我只是简单开个头，或有不确之处。

　　首先一句话：AlphaGo的棋既容易学又不容易学。

　　为什么不容易学？因为ALphaGo所有的着法都是从全局考虑并基于它认为的胜率，如果只是单纯地模仿它的下法，将会掉入巨大的陷阱。

　　陷阱1：AlphaGo的一些下法本身就不是最优，甚至不如人类的选择。例如第一局中的那两个典型”失误“。如果真要学局部的下法，或许只好期待他左右互搏时拿出最强功力(或者对人类的让目对局，总之需要给它增加难度以减少选择。)

　　陷阱2：AlphaGo的下法基于全局，全局形势稍有不同可能就不适用。例如第二局AlphaGo在左下的下法，几乎所有人都认为局部明显亏损。但AlphaGo是基于上边和右边的情况而在左下做出的选择(对此我将在第二部分解说……学习)，这对棋手思维的拓宽有巨大的好处，但具体的着法却不宜照搬。即使是天外飞仙的第37手，也是在独特的局面下才是当时的好棋，如果对任何高拆二都跑去肩冲就成了东施效颦。

　　为什么容易学？因为AlphaGo的围棋技术层级已经在人类之上，它每一盘下出来的招都值得棋手反复思考推敲。仅仅两盘，就已经有这么多的亮点、更多的不解，这绝对是史无前例的棋谱。

　　AlphaGo给出选点的思维方式与人类不同，但我们却可以用人类的方式去理解它，这是一件多么美妙的事情！同一个点，AlphaGo通过数据的方式来给出，人类却用道理的方式来接收，围棋的数与道在这种对话中得到完美的呈现。

　　此文的第二部分原本准备用棋谱解读的方式来呈现我从第二局中看到的无法用言语来表达的震撼和美，但本文或许已经太长，两部分关联性又较弱，更主要的是，天色已大亮……留在下一篇吧。

　　想念吴清源大师。

四处张望 · 发表于 2016-3-12 10:24:17

snark 发表于 2016-3-12 05:324 t/ X6 m! Q5 W, J7 Q; z X4 D" M/ \& ]
我倒不是觉得一定要公开具体参数
' J! b: u. \/ m3 B而是要提供足够证据支持结论，要给出可以证伪的机会，才能让人信服，才 ...

那你可能不太明白围棋在人工智能领域的地位

snark · 发表于 2016-3-12 05:32:29

sitan 发表于 2016-3-12 04:11. U7 a9 y2 g0 |# M: B; V6 J8 [
Nature 最热爱这种花里胡哨的东西了，图多好看啊。Science不一定爱发这样的。
$ o0 W4 z4 `' w) B X$ @9 ?你导师说的是无利益的情况 ...

我倒不是觉得一定要公开具体参数
而是要提供足够证据支持结论，要给出可以证伪的机会，才能让人信服，才算是学术。
Google声称根据某算法思路设计AlphaGo，但是不公开设计的细节，导致该算法思路不可以被其他课题组重复，同时又不给出机会让其他课题组验证AlphaGo的围棋水平，导致其他课题组无法验证AlphaGo的围棋水平。这不就像是车库里的喷火龙吗？
两个棋手签的保密协议，我就搞不懂究竟保密啥。

snark · 发表于 2016-3-12 05:16:52

冰蚁发表于 2016-3-12 03:53( J6 w6 @- D/ W. f" o
那你岂不是把比如 IEEE 底下的好多专业期刊（journal，proceeding ) 全搞成"学术"欺诈了。那里面有学校 ...

我可能说的不确切吧
我指的论文应该仅限于research article
或者完善一下
按industry的搞法发学术论文才是学术欺诈
这样就没问题了吧

		自动登录	找回密码
密码			注册

[科技前沿] 真有在人机大战前放炮的：谷歌AlphaGo是科学欺诈

评分

相关帖子

点评

点评