日本或者韩国也有这么厉害的人工智能围棋程序了？

loy_20002000 · 发表于 2017-1-4 19:20:19

删除失败发表于 2017-1-4 16:34
99%是阿法狗，谢尔盖几个月前到中国棋院来过一次，可能就是商讨第二次人机对抗，这次网棋可能是双方协商 ...

出BUG，很多人不服。对局量太少，不说明问题。

loy_20002000 · 发表于 2017-1-4 21:19:09

上次对李世石故意隐藏实力，让小李子以为弄个奇葩开局计算机会方寸大乱。这次只有对老聂的一盘棋是一分钟快棋，其他都是30秒快棋。DeepMind没诚意，这帮职业还真是配合。

计算机算30秒与人类算30秒是不同的概念。

围棋类AI核心是MCTS类算法产生的经验计算结果，而硬件在对局中死算的求解能力要么是边际递减的要么是线性的，况且硬件的增加并不会线性提升计算能力，当到达一个阈值后计算能力边际递减直到边际效应为零。Go的做法突出了经验结果的重要性，而躲避了计算瓶颈。总结就是Go实战增加计算时间意义不大。

而人类对局的判断方式是先凭借棋感找点，然后细算，再从几个候选方案中确定一个最优方案。

两者对比有：

   找点                                  细算
Go  快，自我对局积累                快，增加计算时间意义不大
Hu  快，经验+学习积累             慢，人类思维单线程+短时长时记忆切换需要时间+机械记忆力有限

单步时间越短Go优势越大，人类反之。

上次对李世石后“据说”DM要清空人类对局库，尤其是开局库，让机器自我对弈学习。对这种说法我很是怀疑。人类对局开始几手无非33、星、55、天元，假如把这几手去掉让机器自己判断，有348个起始点。而这些变化占到围棋博弈树复杂度（博弈树树叶的数量）的96.4%！也就是说DeepMind让机器落在金角附近就不不纯粹了，有人的参与。假设第一点落在哪个星位都没有分别，并且初始点只在9*9的范围内选择，那么不设置人类招法作为第一点，将计算多余的96.3%博弈树。初始落子的选点人已经替机器把大部分非优招法排除了，如果成立的话。听说DM在GitHub开源了部分电子游戏的训练数据，还提供了一个DeepMindLab的接口，不清楚有没有公布围棋的训练数据。如果它有第一手落在各种乱七八糟地方的对局，那么它的系统才是纯粹的非人工。

loy_20002000 · 发表于 2017-1-5 22:08:31

冰蚁发表于 2017-1-5 00:55
增加时间，计算机可以多算几层，人更没戏。

Go不强在这里，强在局势的判断。

loy_20002000 · 发表于 2017-1-5 22:57:03

穿着裤衩裸奔发表于 2017-1-5 20:18
以前欺负机器的时候就说机器没有棋感。
人类的棋感其实是建立在无法精细计算的基础上，不靠谱。
遇到电脑 ...

围棋的博弈树复杂度是10的300次方，计算能力再强也不可能穷尽。棋感不能说完全没用。

Go最大的惊喜是大局观强，死活计算反而不是强项。李世石唯一赢的那盘，死活错误是很低级的，最后一盘的开局误算损失也很大。需要补断，普通人的处理是处理好借用和余味，不会直接补，而Go是直接连成大长棍，笨了点但扎实到没有任何弱点。

我今年两大预测，李世石会赢，希拉里当选，统统错了。诶。

loy_20002000 · 发表于 2017-1-5 23:57:46

本帖最后由 loy_20002000 于 2017-1-6 00:33 编辑

Dracula 发表于 2017-1-5 23:14
我看了几盘Master的棋，力量很大，计算力比和李世石下的AlphaGo版本强大很多。屠起龙来一点也不手软。象 ...

看过与李世石的五盘直播，Master还没看过。力量这么大呀，现在去看下。

—————

刚看过聂卫平的自战解说，不评论Master的实力，单说老聂。

右上58粘那种棋是自灭一眼，换我上也肯定59。白棋净活后黑棋独眼龙，苦。杀是没戏，可以占一些便宜。不过以老聂的力量，就算净活也捞不到多少便宜，他一招败的工夫独步天下。

loy_20002000 · 发表于 2017-1-6 20:55:31

本帖最后由 loy_20002000 于 2017-1-6 21:00 编辑

穿着裤衩裸奔发表于 2017-1-6 10:52
大多数人的大局观都是靠死活计算以及打谱，棋局灌出来的，本质上也是个统计模型。计算机现在算法和计算能 ...

围棋与其他棋类游戏最大的不同是估值函数不平滑，例如国际象棋根据盘面棋子总分+棋子空间辐射可以把局面量化，少一子或多一子不会导致估值函数大起大落，而围棋盘面某个关键点是否有子是差别巨大的。简单累加优势一定是胜势是不一定成立的。

根据《Nature》上DeepMind的那篇文章，Go=策略网络+快速走子网络+估值网络+MCTS（蒙特卡洛树搜索+信心上限算法Upper Confidence Bounds+深度卷积神经网络左右互搏）。这种框架下的AI是肯定有盲点的，人机李世石的4、5局出错就是盲点BUG，第四局的错误我没记错的话DeepMind方面公布是系统误认己方是优势。这个框架有两点很重要，一是局面s估值v（s），二是下一手a价值v（a）的判定，落子选择f（s，a）只要v（s）估计错误或a遗漏了要点就会很麻烦。为了避免a的遗漏或是a自损招法Go在局部也是引入了模式的。

上次对李世石的测试出BUG，过不了多久应该有下一步的测试。期待柯洁或其他超一流的表现，这次不存在轻敌或准备不充分的问题，如果还是大败，人类就是彻底输了。

loy_20002000 · 发表于 2017-1-7 00:09:20

本帖最后由 loy_20002000 于 2017-1-7 00:22 编辑

冰蚁发表于 2017-1-6 22:59
目前这个样子已经是输了。是否搞正式比赛已经意义不大了。

不晓得alphago 是如何解决上次的崩盘的问题的 ...

围棋AI的框架大致是：深度卷积神经网络+蒙特卡洛树搜索。所有人都用类似的方法应该差距不大才对，但Go以外的系统对职业棋手都需要让子才能赢（大致一年前的信息）。Facebook的田博士问过Aja：“我们的平台用80个GPU累积数据，计算力能达到你们的1%吗”Aja含笑不语，他的猜测是到不了1%。DM的硬件计算力肯定世界第一。另外已经公开的算法和资料都很隐晦。其他系统停留在与职业初段抗争，Go（Master）完胜13位世界冠军（大概），这不是硬件能力可以简单解释的，他们或许在方法上取得了突破。

Go出bug的概率较低，上次为什么出bug都是在猜，也许没人猜对，或我没看到官方说法。可能李世石的应招不在或极少出现在训练结构里，导致机器低估那一招的概率，机器判断对手最有利的几个点并且检验的时间比较长，低概率招法占用的资源较少。

DeepMind训练AI玩Atari游戏听说成绩不错，只要是状态（向量空间、局面量化等）+动作的游戏都具有较高通用性。《Super Mario》、飞机类街机游戏、篮球投篮、斯诺克台球等等游戏都是满足的，这类游戏机器完胜人类。不清楚google与暴雪的合作是怎样的，我比较感兴趣的是他们如何处理人类的赌博行为，也就是投机选择。

loy_20002000 · 发表于 2017-2-12 15:36:56

陈王奋起挥黄钺发表于 2017-2-12 15:20
计算机可以找小棋盘找到确定开局最佳点，然后逐步扩大棋盘，从而迅速找到最佳开局的几个候选点。 ...

我好好消化消化，有些想不明白。

loy_20002000 · 发表于 2017-2-12 21:44:50

陈王奋起挥黄钺发表于 2017-2-12 19:46
对于开局最佳点，可以用9线11线13线15线17线棋盘来测试，简化计算，慢慢就可以看出趋势性的东西了。 ...

你的意思我懂，就是具体实现有些抓瞎。没思路，怎么说呢，就是脑子有点空白。

你的说法是可行的。

		自动登录	找回密码
密码			注册

日本或者韩国也有这么厉害的人工智能围棋程序了？

点评

点评

点评