真有在人机大战前放炮的：谷歌AlphaGo是科学欺诈

煮酒正熟 · 发表于 2016-3-9 21:38:56

冰蚁发表于 2016-3-9 02:426 F, K/ r% m" f: R
哈哈哈哈。狗赢了。

李师师一定是签署了不许打劫等等条款了，以至真实势力得不到充分挥发

煮酒正熟 · 发表于 2016-3-9 21:44:57

燕庐敕发表于 2016-3-9 08:04' B4 t. D9 p4 d2 M: M) x
现在赢不了，过个月就不好说啦！

我觉得柯洁辣么说纯属放嘴炮儿。当然他是小孩子，不必苛责。如果阿法狗这次战胜李世石，如果古狗真的向柯洁下战书，两边开战至少也是三个月以后的事了，这三个月阿法狗的棋力增长绝不是柯洁可以望其项背的

煮酒正熟 · 发表于 2016-3-10 21:19:30

史老柒发表于 2016-3-10 07:26. m; g; ^, v# K8 }- x) ^+ j
这个说法是不成立的。因为阿狗会打劫。

呵呵，老七没看出俺那是正华反说呢吗？对樊麾那场俺还真不敢说，但是对李师师这一场，万众瞩目，谷歌绝无可能再玩儿这种桌子底下的招数

煮酒正熟 · 发表于 2016-3-10 21:31:10

删除失败发表于 2016-3-10 07:59/ w) `$ e, ]0 b
在亲眼目睹之前，狗会不会打劫之谜是不会解开的，老梗不必多说。# o3 j" K8 T/ w( W

. c9 f/ N6 H; U! g* D. x9 I4 M6 W% j倒是有个新的疑问：狗是使用了数千个CPU ...

我赞同人机大战时，人应该有打挂的权利。只是我估计这种带有浓重人机决战味道的赛事，也是一个巨大的广告和PR商机，但是打挂对商家来说很讨厌，对普通观战者来说也很烦闷。这些细节需要work out.

另外，CPU很便宜，古狗之所以只用了几千个而不是几万个，几十万，几百万个，是因为增加CPU对提高速度已经没有帮助了。distributed computation的前提是你的整体信息可以在某个维度上做切割。如果你的信息最大限度只能切割成五百块，那么你上1000个CPU就是浪费。

阿法狗如果想继续提升速度（它现在的速度已经明显比李世石快了），唯有依靠算法的提高，也就是价值体系的进一步优化。比如，遇到一个棋型，现在它的价值体系首先要从天文数字的应对方案中遴选出8种来，再对这8种做深度推演。如果未来的价值体系可以从8种降到4种，只对这4种做推演，那样就可以算得更快了

煮酒正熟 · 发表于 2016-3-11 09:48:40

史老柒发表于 2016-3-10 09:56
0 p% L& Y7 Z5 O+ e3 V阿狗和樊麾对弈第五局第154手阿狗跟对方互相提劫玩来着。

前面有一堆人说阿法狗不会打劫，现在都跑哪儿去了？另外爱坛的国手呢？@夜观天象 @胖得妙不可

煮酒正熟 · 发表于 2016-3-11 10:59:16

本帖最后由煮酒正熟于 2016-3-10 22:00 编辑

删除失败发表于 2016-3-10 20:36
7 f3 h" z, J. d# A您的回复让我有了一个想法，
9 N+ H2 l. u4 Z7 |& h4 o# f3 r8 o
5 I/ e, R& ]9 g5 ]' B3 s1 d. m, X+ G阿法狗的深度学习神经网络是不是可以理解为回归分析，基础数据是人类的棋谱 ...

阿法狗到底是怎么回事，我也不十分清楚，只根据我的猜测胡乱说两句吧。
传统棋类AI的基础是蒙特卡洛树型搜索 (Monte Carlo Tree Search). 阿法狗自然也有这个。但这个是很低级的计算方法，不是高级算法。阿法狗算法里面的高级部分是价值网络和政策网络，这两个东西合在一起，就是要模仿人类棋手的“棋感"。价值网络和政策网络负责掌控宏观形势，基于对宏观形势的研判，指挥蒙特卡洛做有限的树型搜索。注意有限两个字。如果没有价值网络和政策网络的宏观指导，光靠蒙特卡洛树型搜索去下棋，以围棋10的170次方的近乎无限种的应对方式，阿法狗一步棋会下到地老天荒。

价值网络和政策网络的技术基础，是很高端的所谓深度神经网络技术。这个俺不懂，就不乱说了。

说到底，阿法狗之所以下起棋来比较像人，就是因为它有着相当复杂精妙的价值网络和政策网络。它在实战中的应对之所以屡屡技高一筹，得益于大数据时代的软硬件（比如cloud computing，你说它是硬件还是软件？）

至于你说的布局方面要打破常规，我觉得最大的可能是被狗狗直接识破并干翻。狗狗从一出生，喂给它的就是职业高手的应对之法，一开始也许是囫囵吞枣知其然不知其所以然，但训练久了，它就逐渐明白什么是假招儿虚招儿了，也就是说已经知其所以然了。就算你玩儿什么百花错拳，妄图乱拳打死老师傅，最多也就只能赢它一盘，甚至连赢都赢不了，只能暂时抢到一些优势。长久来说，百花错拳完全无用。

		自动登录	找回密码
密码			注册

[科技前沿] 真有在人机大战前放炮的：谷歌AlphaGo是科学欺诈

点评

点评

点评