爱吱声

标题: 人狗大战第二季，赵治勋2:1DeepZenGo [打印本页]

作者: 删除失败 时间: 2016-11-25 15:41
标题: 人狗大战第二季，赵治勋2:1DeepZenGo
本帖最后由删除失败于 2016-11-25 23:35 编辑

半年前alphago击败李世石之后，围棋的人机大战沉寂了下来，直到本月战斗又再度打响，登场的日本老牌围棋AI ZEN带来的DeepZenGo（人称深圳狗，地震狗）挑战日本传奇棋手赵治勋。

在alphago出现之前ZEN一直是围棋AI的领跑者之一，最先引入了蒙特卡洛算法大大提高了AI的实力，但近两年进步不大直到alphago公布了神经网络算法，被ZEN引入到今年发售的ZEN6中，使ZEN的实力有了脱胎换骨的变化。有国内棋友用ZEN6打上了弈城9D，不过似乎站不稳。本人对ZEN6也是胜少负多，即使赢的棋也是绞尽脑汁，特别是开局一不小心就容易走崩。不过时间一长，很多棋友发现了ZEN6在官子上乏善可陈，同时在角部的死活计算特别是涉及到打劫杀气的时候经常出现误算。不管怎么样ZEN6的成功显然让开发者信心大增，终于提出用进一步改进的深圳狗分先挑战赵治勋，而且用的还不是像alphago那样1千多个CPU的分布式系统，只是用了至强处理器的性能比较强的单机。

最终结果是老赵2:1获胜。不过3盘棋的过程很有意思。

第一局，老赵的开局略处下风，不得不说现在的围棋AI布局上确实很强，不过很快深圳狗似乎在两个角地的死活计算中出现了误算，老赵开始领先，而我用ZEN6跟踪棋局，ZEN6认为深圳狗的胜率甚至一度达到80%，不知道深圳狗自评是不是也是这样，以至于招法看起来像劝降老赵，直到角部定型深圳狗才如梦方醒，但胜率已开始雪崩，最后老赵稳稳守住了优势，深圳狗的肉臂加藤中盘投子认负。

第一局获胜后，老赵似乎略有轻敌，第二局开局就大亏，似乎是为了兑现第一局结束后要更强硬的承诺，老赵又无理挑起战斗，而深圳狗展现了强大的中盘实力，始终压着老赵，最后逼得老赵在深圳狗的滔天外势中裸奔治孤，深圳狗毫不手软屠龙获胜。

第三局一开始似乎又是第二局的翻版，老赵四处抢夺实地，但在局势上并不占优，不过倒也没落后太多。进入后半盘，老赵开始发力，一点一点挽回局面，终于实现了反超，深圳狗官子弱的预言似乎得到了证实。不过这时候出现了戏剧性的一幕，终盘前老赵中腹施展妙手分断深圳狗的白棋，白棋似乎亏损但并没有明确的结论，老赵即使领先也优势细微，此时肉臂加藤竟然就投子认负了！局后从棋友到职业棋手都进行了讨论，虽然大多数倾向老赵领先，但棋并没有结束是肯定的。有说法是深圳狗在劣势下，下了一招不知所云的棋，加藤怕丢人就主动认负了，但没有得到证实。这成了此次三番棋的一桩悬案。

无疑不管是软硬件深圳狗和阿法狗相比都还差得很远，按DeepMind的黄士杰的说法，深圳狗的实力和与樊麾对局时的阿法狗相当，而赵治勋虽然不复七番魔王的风采，实力压过樊麾还是没问题的，所以2:1的结果并不让人意外。深圳狗虽然在大局观上表现出了相当的实力，但在局部死活和官子上暴露出的缺陷给了人类棋手和将来阿法狗对抗提供了一些思路。据说，阿法狗不仅纠正了当初第四局被一挖后神经错乱的缺陷，经过又半年的自我学习，实力已涨到能让顶尖的人类棋手三子，来年即将出山再次摆擂。不过我对第二次阿法狗挑战人类能否成行并不看好。谷歌无疑对围棋并没有什么特殊的感情，只不过是发展人工智能的一个切入点，既然已经赢下一次，有什么动力再次付出人力物力财力再和人类下一次呢。另一方面李世石虽然输了，也为以后人机对局提供了经验，如再次对局人类棋手一方势必在对局时间，规则甚至是否集体参与等细节上讨价还价，想各方面最终达成协议，困难不小。

不过下次人机大战的AI未必就是阿法狗，按黄士杰的说法，国内已有多家公司开发了围棋AI，并有职业棋手进行了测试，人称中华田园狗，而在弈城上也有一个叫绝艺的ID，下法高度类似围棋AI，他不仅只和职业棋手对局，胜率还极高，还和柯洁下成了1:1，用时还比柯洁更少，同时在败局已定时也会走毫无逻辑的棋，如果确实是围棋AI，那说明国内在此类人工智能上也达到了比较高的水平。所以老赵拿下深圳狗，可能只是第二季的开始，而不是结束。

作者: 月近天心 时间: 2016-11-25 17:47
三盘都看了
觉得这位深圳狗好像比阿尔法狗差不少，不知道要是这俩程序直接怼上是什么情况。
老赵外形是越来越老顽童化了
看看这位加藤英树，不知道要是叫小松剑正是不是就能和职业棋手过过着了？

作者: 大脚丫 时间: 2016-11-25 21:54
本帖最后由大脚丫于 2016-11-25 22:00 编辑

柯洁在微博上点评深圳狗这个投子认负为三局之亮点，他摆了变化说明有可能白会崩掉。具体可以看他的微博。

==================

另外，阿法狗明年一月又要出山了，这次估计是要彻底打服人类棋手，因为据说这半年来它的棋力又大增了。

作者: 删除失败 时间: 2016-11-25 23:42

大脚丫发表于 2016-11-25 21:54
柯洁在微博上点评深圳狗这个投子认负为三局之亮点，他摆了变化说明有可能白会崩掉。具体可以看他的微博。

...

这里关键不是白棋会不会崩，而是加藤不应该自己替深圳狗做决定，需要柯洁出来解释本身就说明当时的局面并不明朗。唯一合理的解释深圳狗的下法毫无道理，加藤藏拙，可惜无法证实。

作者: 冰蚁 时间: 2016-11-26 00:12
本帖最后由冰蚁于 2016-11-25 11:22 编辑

围棋的人机大战已经没啥意思了。deepmind 已经把门槛过了。剩下的只是再完善完善。我现在倒是很期待 deepmind 和人类选手在 starcraft II 上的对决。这个会是AI领域的又一个巨大进步。不过我估计人类又要被完虐。

作者: 燕庐敕 时间: 2016-11-26 01:06

月近天心发表于 2016-11-25 17:47
三盘都看了
觉得这位深圳狗好像比阿尔法狗差不少，不知道要是这俩程序直接怼上是什么情况。
老赵外形是越来 ...

小松英树没得过本因坊，加藤死于脑溢血。

改名不吉利，嘻嘻。

作者: 燕庐敕 时间: 2016-11-26 01:08

冰蚁发表于 2016-11-26 00:12
围棋的人机大战已经没啥意思了。deepmind 已经把门槛过了。剩下的只是再完善完善。我现在倒是很期待 deepmi ...

其实也属于有备打无备，和军事上的偷袭类似。

要是阿尔法狗公开最近1000盘对局，人类棋手研究后只怕也是旗鼓相当。

作者: 穿着裤衩裸奔 时间: 2016-11-26 10:30

燕庐敕发表于 2016-11-26 01:08
其实也属于有备打无备，和军事上的偷袭类似。

要是阿尔法狗公开最近1000盘对局，人类棋手研究后只怕也是 ...

人肉集群计算 VS 计算机集群计算

作者: 把酒临风长歌行 时间: 2016-11-26 11:25
呵呵，说白了，阿尔法狗的做法就相当于“乾坤大挪移”，脑子里存的棋局多，于是就用某个棋手在某局的下法，去克制另一个棋风受克的棋手，脑子里的棋谱随调随用，胜率高，就是因为棋谱库存多，而棋手在绝大多数情况下的下法其实是重复或类似的，所以阿尔法狗总能找到克制对方的方法，但是如果某位天才棋手独辟蹊径，走出了现有棋谱中没有的制胜下法，阿尔法狗可能就.....

作者: 冰蚁 时间: 2016-11-26 12:04

把酒临风长歌行发表于 2016-11-25 22:25
呵呵，说白了，阿尔法狗的做法就相当于“乾坤大挪移”，脑子里存的棋局多，于是就用某个棋手在某局的下法， ...

你这个是错误的。早过了这个阶段。

作者: 把酒临风长歌行 时间: 2016-11-26 15:47

冰蚁发表于 2016-11-26 12:04
你这个是错误的。早过了这个阶段。

呵呵，那敢问现在到了哪个阶段？有何特征表现？

作者: 大脚丫 时间: 2016-11-26 15:52

删除失败发表于 2016-11-25 23:42
这里关键不是白棋会不会崩，而是加藤不应该自己替深圳狗做决定，需要柯洁出来解释本身就说明当时的局面并 ...

我倒不知道是加藤替深圳狗决定的，这个是违例了吧？不是肉臂吗？怎么可以带脑呢。

不过据说当时的盘面白棋也已经不够了，白棋即使不崩，被破空的话也是输更多。

还有你的说法自相矛盾啊？如果只有柯洁看清，加藤藏的哪门子拙呢?
=================
阿法狗的厉害在于计算方面已经完胜人类棋手了，如果是13X13的棋盘估计早就没法下了，现在这个19x19棋盘的悬念也用不了多久就打破。其实职业高手也是靠计算，只有算不清的情况才讲什么感觉。
阿法狗给棋手的提示在于对于以往经验的再认识。

作者: loy_20002000 时间: 2016-11-26 16:52

冰蚁发表于 2016-11-26 00:12
围棋的人机大战已经没啥意思了。deepmind 已经把门槛过了。剩下的只是再完善完善。我现在倒是很期待 deepmi ...

不可能。

1）围棋是信息透明的，而《星际2》不是。人类选手放大招，dm没侦查到就挂了。《星际2》这种游戏不同于《1》，想要做到完全侦查是不可能的。

2）围棋存在最优解，可以逼近，而《星际2》没有。围棋AI是概率逼近，人是非理性的没法概率逼近。用概率逼近的方式玩RTS游戏，《星际2》的博弈树复杂度可能远远高于围棋，甚至高出n个量级。游戏本身的地图因素是可以影响到平衡性的，在一张地图训练出来的解不能适用于另外的地图。

作者: loy_20002000 时间: 2016-11-26 16:59

大脚丫发表于 2016-11-26 15:52
我倒不知道是加藤替深圳狗决定的，这个是违例了吧？不是肉臂吗？怎么可以带脑呢。

不过据说当时的盘面白 ...

说狗完胜人类为时过早。

1）李世石的错误选择80%柯洁在实际进程前就预判到了。

2）样本太小。

3）与李世石对局五盘，出现一个大bug，和一个严重误算。

作者: 冰蚁 时间: 2016-11-26 22:21

loy_20002000 发表于 2016-11-26 03:52
不可能。

1）围棋是信息透明的，而《星际2》不是。人类选手放大招，dm没侦查到就挂了。《星际2》这种游 ...

这个训练显然是不会训练成依赖地图的解。总而言之，拭目以待吧。

作者: loy_20002000 时间: 2016-11-26 22:42

冰蚁发表于 2016-11-26 22:21
这个训练显然是不会训练成依赖地图的解。总而言之，拭目以待吧。

您老兄不玩RTS游戏吧。

韩国的SC1联赛世界闻名，比赛能办这么多年就是靠主办方不断修改地图。从1.08b后暴雪就没做过平衡性改动了，而游戏本身是不平衡的。玩过SC1的都知道lost temple、big game hunters，这两张图是terran主场。而平台流行的fast图是protoss无解。计算机不知道地图的平衡性选择中庸开局，发展5分钟后中庸一方几乎就没法打了。

另外星际2暴雪做了大量操作简化，玩家需要做的仅仅是正面对抗、骚扰、战略战术的制定。其他的操作是系统自动完成的，例如terran的SCV自动采矿，造兵自动分兵营造。

作者: 冰蚁 时间: 2016-11-26 23:17

loy_20002000 发表于 2016-11-26 09:42
您老兄不玩RTS游戏吧。

韩国的SC1联赛世界闻名，比赛能办这么多年就是靠主办方不断修改地图。从1.08b后 ...

我现在不玩，但以前玩过，最早要算到dune II 了。sc2也玩过一阵。所以地图的重要性我自然清楚。一个AI系统的训练也是绝对不会训练成和地图高度相关的。这样的AI没有弹性。这种思路和楼上那位讲的记棋谱是一个思路。deepmind 已经过了这个槛了。和人类选手比赛时候的地图也应该是张对双方而言都是新的地图。所以把AI训练成依赖地图也毫无意义。

作者: loy_20002000 时间: 2016-11-26 23:36

冰蚁发表于 2016-11-26 23:17
我现在不玩，但以前玩过，最早要算到dune II 了。sc2也玩过一阵。所以地图的重要性我自然清楚。一个AI系 ...

嗯，等着看。就是不知道什么时候有前戏，我也十分期待。

欢迎光临爱吱声 (http://aswetalk.net/bbs/)