设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
楼主: 燕庐敕
打印 上一主题 下一主题

日本或者韩国也有这么厉害的人工智能围棋程序了?

[复制链接]
  • TA的每日心情
    慵懒
    2018-6-21 13:05
  • 签到天数: 21 天

    [LV.4]金丹

    楼主
    发表于 2017-1-4 19:20:19 | 显示全部楼层
    删除失败 发表于 2017-1-4 16:34
    99%是阿法狗,谢尔盖几个月前到中国棋院来过一次,可能就是商讨第二次人机对抗,这次网棋可能是双方协商 ...

    出BUG,很多人不服。对局量太少,不说明问题。
  • TA的每日心情
    慵懒
    2018-6-21 13:05
  • 签到天数: 21 天

    [LV.4]金丹

    沙发
    发表于 2017-1-4 21:19:09 | 显示全部楼层
    上次对李世石故意隐藏实力,让小李子以为弄个奇葩开局计算机会方寸大乱。这次只有对老聂的一盘棋是一分钟快棋,其他都是30秒快棋。DeepMind没诚意,这帮职业还真是配合。

    计算机算30秒与人类算30秒是不同的概念。

    围棋类AI核心是MCTS类算法产生的经验计算结果,而硬件在对局中死算的求解能力要么是边际递减的要么是线性的,况且硬件的增加并不会线性提升计算能力,当到达一个阈值后计算能力边际递减直到边际效应为零。Go的做法突出了经验结果的重要性,而躲避了计算瓶颈。总结就是Go实战增加计算时间意义不大。

    而人类对局的判断方式是先凭借棋感找点,然后细算,再从几个候选方案中确定一个最优方案。

    两者对比有:

          找点                                   细算
    Go  快,自我对局积累                 快,增加计算时间意义不大
    Hu  快,经验+学习积累               慢,人类思维单线程+短时长时记忆切换需要时间+机械记忆力有限

    单步时间越短Go优势越大,人类反之。

    上次对李世石后“据说”DM要清空人类对局库,尤其是开局库,让机器自我对弈学习。对这种说法我很是怀疑。人类对局开始几手无非33、星、55、天元,假如把这几手去掉让机器自己判断, 有348个起始点。而这些变化占到围棋博弈树复杂度(博弈树树叶的数量)的96.4%!也就是说DeepMind让机器落在金角附近就不不纯粹了,有人的参与。假设第一点落在哪个星位都没有分别,并且初始点只在9*9的范围内选择,那么不设置人类招法作为第一点,将计算多余的96.3%博弈树。初始落子的选点人已经替机器把大部分非优招法排除了,如果成立的话。听说DM在GitHub开源了部分电子游戏的训练数据,还提供了一个DeepMindLab的接口,不清楚有没有公布围棋的训练数据。如果它有第一手落在各种乱七八糟地方的对局,那么它的系统才是纯粹的非人工。
  • TA的每日心情
    慵懒
    2018-6-21 13:05
  • 签到天数: 21 天

    [LV.4]金丹

    板凳
    发表于 2017-1-5 22:08:31 | 显示全部楼层
    冰蚁 发表于 2017-1-5 00:55
    增加时间,计算机可以多算几层,人更没戏。

    Go不强在这里,强在局势的判断。
  • TA的每日心情
    慵懒
    2018-6-21 13:05
  • 签到天数: 21 天

    [LV.4]金丹

    地板
    发表于 2017-1-5 22:57:03 | 显示全部楼层
    穿着裤衩裸奔 发表于 2017-1-5 20:18
    以前欺负机器的时候就说机器没有棋感。
    人类的棋感其实是建立在无法精细计算的基础上,不靠谱。
    遇到电脑 ...

    围棋的博弈树复杂度是10的300次方,计算能力再强也不可能穷尽。棋感不能说完全没用。

    Go最大的惊喜是大局观强,死活计算反而不是强项。李世石唯一赢的那盘,死活错误是很低级的,最后一盘的开局误算损失也很大。需要补断,普通人的处理是处理好借用和余味,不会直接补,而Go是直接连成大长棍,笨了点但扎实到没有任何弱点。

    我今年两大预测,李世石会赢,希拉里当选,统统错了。诶。

    点评

    俺预测都对了。:D  发表于 2017-1-5 23:18
  • TA的每日心情
    慵懒
    2018-6-21 13:05
  • 签到天数: 21 天

    [LV.4]金丹

    5#
    发表于 2017-1-5 23:57:46 | 显示全部楼层
    本帖最后由 loy_20002000 于 2017-1-6 00:33 编辑
    Dracula 发表于 2017-1-5 23:14
    我看了几盘Master的棋,力量很大,计算力比和李世石下的AlphaGo版本强大很多。屠起龙来一点也不手软。象 ...


    看过与李世石的五盘直播,Master还没看过。力量这么大呀,现在去看下。

    —————

    刚看过聂卫平的自战解说,不评论Master的实力,单说老聂。

    右上58粘那种棋是自灭一眼,换我上也肯定59。白棋净活后黑棋独眼龙,苦。杀是没戏,可以占一些便宜。不过以老聂的力量,就算净活也捞不到多少便宜,他一招败的工夫独步天下。
  • TA的每日心情
    慵懒
    2018-6-21 13:05
  • 签到天数: 21 天

    [LV.4]金丹

    6#
    发表于 2017-1-6 20:55:31 | 显示全部楼层
    本帖最后由 loy_20002000 于 2017-1-6 21:00 编辑
    穿着裤衩裸奔 发表于 2017-1-6 10:52
    大多数人的大局观都是靠死活计算以及打谱,棋局灌出来的,本质上也是个统计模型。计算机现在算法和计算能 ...

    围棋与其他棋类游戏最大的不同是估值函数不平滑,例如国际象棋根据盘面棋子总分+棋子空间辐射可以把局面量化,少一子或多一子不会导致估值函数大起大落,而围棋盘面某个关键点是否有子是差别巨大的。简单累加优势一定是胜势是不一定成立的。

    根据《Nature》上DeepMind的那篇文章,Go=策略网络+快速走子网络+估值网络+MCTS(蒙特卡洛树搜索+信心上限算法Upper Confidence Bounds+深度卷积神经网络左右互搏)。这种框架下的AI是肯定有盲点的,人机李世石的4、5局出错就是盲点BUG,第四局的错误我没记错的话DeepMind方面公布是系统误认己方是优势。这个框架有两点很重要,一是局面s估值v(s),二是下一手a价值v(a)的判定,落子选择f(s,a)只要v(s)估计错误或a遗漏了要点就会很麻烦。为了避免a的遗漏或是a自损招法Go在局部也是引入了模式的。

    上次对李世石的测试出BUG,过不了多久应该有下一步的测试。期待柯洁或其他超一流的表现,这次不存在轻敌或准备不充分的问题,如果还是大败,人类就是彻底输了。

    点评

    涨姿势: 5.0
    涨姿势: 5
      发表于 2017-1-23 23:52
  • TA的每日心情
    慵懒
    2018-6-21 13:05
  • 签到天数: 21 天

    [LV.4]金丹

    7#
    发表于 2017-1-7 00:09:20 | 显示全部楼层
    本帖最后由 loy_20002000 于 2017-1-7 00:22 编辑
    冰蚁 发表于 2017-1-6 22:59
    目前这个样子已经是输了。是否搞正式比赛已经意义不大了。

    不晓得alphago 是如何解决上次的崩盘的问题的 ...

    围棋AI的框架大致是:深度卷积神经网络+蒙特卡洛树搜索。所有人都用类似的方法应该差距不大才对,但Go以外的系统对职业棋手都需要让子才能赢(大致一年前的信息)。Facebook的田博士问过Aja:“我们的平台用80个GPU累积数据,计算力能达到你们的1%吗”Aja含笑不语,他的猜测是到不了1%。DM的硬件计算力肯定世界第一。另外已经公开的算法和资料都很隐晦。其他系统停留在与职业初段抗争,Go(Master)完胜13位世界冠军(大概),这不是硬件能力可以简单解释的,他们或许在方法上取得了突破。

    Go出bug的概率较低,上次为什么出bug都是在猜,也许没人猜对,或我没看到官方说法。可能李世石的应招不在或极少出现在训练结构里,导致机器低估那一招的概率,机器判断对手最有利的几个点并且检验的时间比较长,低概率招法占用的资源较少。

    DeepMind训练AI玩Atari游戏听说成绩不错,只要是状态(向量空间、局面量化等)+动作的游戏都具有较高通用性。《Super Mario》、飞机类街机游戏、篮球投篮、斯诺克台球等等游戏都是满足的,这类游戏机器完胜人类。不清楚google与暴雪的合作是怎样的,我比较感兴趣的是他们如何处理人类的赌博行为,也就是投机选择。

    点评

    涨姿势: 5.0
    涨姿势: 5
      发表于 2017-1-23 23:53
  • TA的每日心情
    慵懒
    2018-6-21 13:05
  • 签到天数: 21 天

    [LV.4]金丹

    8#
    发表于 2017-2-12 15:36:56 | 显示全部楼层
    陈王奋起挥黄钺 发表于 2017-2-12 15:20
    计算机可以找小棋盘找到确定开局最佳点,然后逐步扩大棋盘, 从而迅速找到最佳开局的几个候选点。 ...

    我好好消化消化,有些想不明白。
  • TA的每日心情
    慵懒
    2018-6-21 13:05
  • 签到天数: 21 天

    [LV.4]金丹

    9#
    发表于 2017-2-12 21:44:50 | 显示全部楼层
    陈王奋起挥黄钺 发表于 2017-2-12 19:46
    对于开局最佳点, 可以用9线11线13线15线17线棋盘来测试,简化计算,慢慢就可以看出趋势性的东西了。 ...

    你的意思我懂,就是具体实现有些抓瞎。没思路,怎么说呢,就是脑子有点空白。

    你的说法是可行的。

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2024-5-20 19:42 , Processed in 0.044470 second(s), 18 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表