注册 登录
爱吱声 返回首页

testjhy的个人空间 http://aswetalk.net/bbs/?4473 [收藏] [复制] [分享] [RSS]

日志

跟风龙教授谈AI--狗狗的真相(一)

热度 33已有 445 次阅读2024-8-2 08:01 |个人分类:聊天

AlphaGo出彩后,DeepMind团队后续又发展了两个产品,AlphaGoZero,AlphaZero,三个产品我们简称为阿狗,阿狗C罗和阿C罗,
阿狗是依托日本围棋协会积累的2000万棋局利用深度学习算法和蒙特卡罗评估算法实现了对人类的超越。深度学习算法根据2000万棋局的学习保证下一手的下法是高质量的,蒙特卡罗树状评估在围棋规则时间内搜索足够深度保证全局最优,这完全碾压了人类的智能。
阿狗C罗是在阿狗基础上用强化学习算法,找出超人类的围棋算法。所谓的左右互博,是指阿狗C罗对阵阿狗,阿狗C罗在阿狗下一手后,随机下另一手,然后评估这手的价值,这样在所有着法中找到最佳下法,这种试探方法叫强化学习,只要计算机足够强,又没有围棋时间限制,肯定能找到更好的棋路,所以阿狗C罗三天后战胜阿狗(胜率大于50%),42天后碾压阿狗(胜率在90%以上)。这不是不依赖棋谱,这是一个武林聪明小子整天缠着天下第一高手试剑法,最后成为天下第一高手的故事。没有阿狗,这个吃了2000万棋谱的第一高手,哪来的阿狗C罗。
DeepMind后来依照上述套路,又培养了阿C罗,不带狗了,拓展了国际象棋和日本将棋。当然看了阿狗的风采,国际象棋和日本将棋人类高手就不再出马,阿C罗战胜了国际象棋和日本将棋的网络冠军。
阿狗故事截止在2016年,后面发展没有深究,

有时间再谈谈,深度学习、大模型及逻辑思维
12

膜拜

鸡蛋
16

鲜花

路过

雷人
1

开心
2

感动

难过

刚表态过的朋友 (31 人)

发表评论 评论 (9 个评论)

回复 龙血树 2024-8-2 09:31
多谢,名副其实抛砖引玉了
回复 龙血树 2024-8-2 09:36
AI这一工具对人类社会将有再一次的工业革命般的影响,其影响之深度广度目前内行未必去深思,值得广泛的跨学科的探讨和认知。包括我这种外行,因为外行是多数,知识的分享必将是内行带动外行。
回复 五月 2024-8-2 10:20
原来有这么多细节,学习了。赞一个
回复 无言 2024-8-2 10:30
和柯棋渣对阵的是阿狗c罗?
回复 testjhy 2024-8-2 15:55
无言: 和柯棋渣对阵的是阿狗c罗?
阿狗也分不同版本,战胜李世石和战胜柯渣的版本好象不同,这包括硬件的调整和算法的进步,柯渣在后,阿狗的能力应该更强些。两个顶级选手的失败,应该使人类选手止步了,阿狗C罗没听说与人类选手下过棋。
回复 忧郁金桥 2024-8-2 21:32
现今高水平的围棋杯赛,受AI的影响越来越严重,以后还能做到公平的博弈吗?实在是想不明白了。
回复 testjhy 2024-8-3 00:06
忧郁金桥: 现今高水平的围棋杯赛,受AI的影响越来越严重,以后还能做到公平的博弈吗?实在是想不明白了。
应该没问题的,我爱看中国象棋,这个AI更比人强。人向强软学习后,能掌握也不容易呢。
回复 忧郁金桥 2024-8-3 13:25
testjhy: 应该没问题的,我爱看中国象棋,这个AI更比人强。人向强软学习后,能掌握也不容易呢。
教授,我担心的不是棋手学习AI,而是他们利用AI作弊,在利益面前人性是毫无抵抗力的。
回复 沉宝 2024-8-4 15:03
testjhy: 应该没问题的,我爱看中国象棋,这个AI更比人强。人向强软学习后,能掌握也不容易呢。
中国象棋相对简单,仅凭蒙特卡罗算法就可以战胜人类。阿狗深度学习算法的一个主要功能是对当前局面的评估。(象棋的简单局面评估可以数子,例如一车大约等于马加炮,这在没有入局杀招时比较有效)。深学可以推荐下一手,但下一手的好坏要靠蒙特卡罗算法加以验证。

facelist doodle 涂鸦板

您需要登录后才可以评论 登录 | 注册

手机版|小黑屋|Archiver|网站错误报告|爱吱声   

GMT+8, 2024-9-17 03:13 , Processed in 0.027454 second(s), 19 queries , Gzip On.

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

返回顶部