日志

跟风龙教授谈AI--狗狗的真相(一)

热度 33已有 445 次阅读2024-8-2 08:01 |个人分类:聊天

AlphaGo出彩后，DeepMind团队后续又发展了两个产品，AlphaGoZero，AlphaZero，三个产品我们简称为阿狗，阿狗C罗和阿C罗，

阿狗是依托日本围棋协会积累的2000万棋局利用深度学习算法和蒙特卡罗评估算法实现了对人类的超越。深度学习算法根据2000万棋局的学习保证下一手的下法是高质量的，蒙特卡罗树状评估在围棋规则时间内搜索足够深度保证全局最优，这完全碾压了人类的智能。

阿狗C罗是在阿狗基础上用强化学习算法，找出超人类的围棋算法。所谓的左右互博，是指阿狗C罗对阵阿狗，阿狗C罗在阿狗下一手后，随机下另一手，然后评估这手的价值，这样在所有着法中找到最佳下法，这种试探方法叫强化学习，只要计算机足够强，又没有围棋时间限制，肯定能找到更好的棋路，所以阿狗C罗三天后战胜阿狗(胜率大于50%)，42天后碾压阿狗(胜率在90%以上)。这不是不依赖棋谱，这是一个武林聪明小子整天缠着天下第一高手试剑法，最后成为天下第一高手的故事。没有阿狗，这个吃了2000万棋谱的第一高手，哪来的阿狗C罗。

DeepMind后来依照上述套路，又培养了阿C罗，不带狗了，拓展了国际象棋和日本将棋。当然看了阿狗的风采，国际象棋和日本将棋人类高手就不再出马，阿C罗战胜了国际象棋和日本将棋的网络冠军。

阿狗故事截止在2016年，后面发展没有深究，

有时间再谈谈，深度学习、大模型及逻辑思维

膜拜

鸡蛋

鲜花

路过

雷人

开心

感动

难过

刚表态过的朋友 (31 人)

收藏分享邀请举报

全部作者的其他最新日志

发表评论评论 (9 个评论)

回复龙血树 2024-8-2 09:31: 多谢，名副其实抛砖引玉了

回复龙血树 2024-8-2 09:36: AI这一工具对人类社会将有再一次的工业革命般的影响，其影响之深度广度目前内行未必去深思，值得广泛的跨学科的探讨和认知。包括我这种外行，因为外行是多数，知识的分享必将是内行带动外行。

回复五月 2024-8-2 10:20: 原来有这么多细节，学习了。赞一个

回复无言 2024-8-2 10:30: 和柯棋渣对阵的是阿狗c罗？

回复 testjhy 2024-8-2 15:55: 无言: 和柯棋渣对阵的是阿狗c罗？
阿狗也分不同版本，战胜李世石和战胜柯渣的版本好象不同，这包括硬件的调整和算法的进步，柯渣在后，阿狗的能力应该更强些。两个顶级选手的失败，应该使人类选手止步了，阿狗C罗没听说与人类选手下过棋。

回复忧郁金桥 2024-8-2 21:32: 现今高水平的围棋杯赛，受AI的影响越来越严重，以后还能做到公平的博弈吗？实在是想不明白了。

回复 testjhy 2024-8-3 00:06: 忧郁金桥: 现今高水平的围棋杯赛，受AI的影响越来越严重，以后还能做到公平的博弈吗？实在是想不明白了。
应该没问题的，我爱看中国象棋，这个AI更比人强。人向强软学习后，能掌握也不容易呢。

回复忧郁金桥 2024-8-3 13:25: testjhy: 应该没问题的，我爱看中国象棋，这个AI更比人强。人向强软学习后，能掌握也不容易呢。
教授，我担心的不是棋手学习AI，而是他们利用AI作弊，在利益面前人性是毫无抵抗力的。

回复沉宝 2024-8-4 15:03: testjhy: 应该没问题的，我爱看中国象棋，这个AI更比人强。人向强软学习后，能掌握也不容易呢。
中国象棋相对简单，仅凭蒙特卡罗算法就可以战胜人类。阿狗深度学习算法的一个主要功能是对当前局面的评估。（象棋的简单局面评估可以数子，例如一车大约等于马加炮，这在没有入局杀招时比较有效）。深学可以推荐下一手，但下一手的好坏要靠蒙特卡罗算法加以验证。

testjhy的个人空间 http://aswetalk.net/bbs/?4473 [收藏] [复制] [分享] [RSS]

日志

跟风龙教授谈AI--狗狗的真相(一)

刚表态过的朋友 (31 人)

全部作者的其他最新日志

发表评论 评论 (9 个评论)

testjhy

发表评论评论 (9 个评论)