设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
楼主: 燕庐敕
打印 上一主题 下一主题

[科技前沿] 真有在人机大战前放炮的:谷歌AlphaGo是科学欺诈

[复制链接]
  • TA的每日心情
    郁闷
    2022-6-19 00:00
  • 签到天数: 2264 天

    [LV.Master]无

    楼主
    发表于 2016-3-9 21:38:56 | 显示全部楼层
    冰蚁 发表于 2016-3-9 02:426 F, K/ r% m" f: R
    哈哈哈哈。狗赢了。
    * K" W* H  b" O" c: I5 p% `
    李师师一定是签署了不许打劫等等条款了,以至真实势力得不到充分挥发

    点评

    油墨: 5.0 油菜: 5.0
    油墨: 5 油菜: 5
    今晚继续哈。  发表于 2016-3-9 21:39
  • TA的每日心情
    郁闷
    2022-6-19 00:00
  • 签到天数: 2264 天

    [LV.Master]无

    沙发
    发表于 2016-3-9 21:44:57 | 显示全部楼层
    燕庐敕 发表于 2016-3-9 08:04' B4 t. D9 p4 d2 M: M) x
    现在赢不了,过个月就不好说啦!
    % D2 W9 Z" Y3 m- ?) z
    我觉得柯洁辣么说纯属放嘴炮儿。当然他是小孩子,不必苛责。如果阿法狗这次战胜李世石,如果古狗真的向柯洁下战书,两边开战至少也是三个月以后的事了,这三个月阿法狗的棋力增长绝不是柯洁可以望其项背的
  • TA的每日心情
    郁闷
    2022-6-19 00:00
  • 签到天数: 2264 天

    [LV.Master]无

    板凳
    发表于 2016-3-10 21:19:30 | 显示全部楼层
    史老柒 发表于 2016-3-10 07:26. m; g; ^, v# K8 }- x) ^+ j
    这个说法是不成立的。因为阿狗会打劫。

    ! B' M; j6 k( {6 b2 Z呵呵,老七没看出俺那是正华反说呢吗?对樊麾那场俺还真不敢说,但是对李师师这一场,万众瞩目,谷歌绝无可能再玩儿这种桌子底下的招数
  • TA的每日心情
    郁闷
    2022-6-19 00:00
  • 签到天数: 2264 天

    [LV.Master]无

    地板
    发表于 2016-3-10 21:31:10 | 显示全部楼层
    删除失败 发表于 2016-3-10 07:59/ w) `$ e, ]0 b
    在亲眼目睹之前,狗会不会打劫之谜是不会解开的,老梗不必多说。# o3 j" K8 T/ w( W

    . c9 f/ N6 H; U! g* D. x9 I4 M6 W% j倒是有个新的疑问:狗是使用了数千个CPU ...
    0 i& y/ v+ n& [# \6 O
    我赞同人机大战时,人应该有打挂的权利。只是我估计这种带有浓重人机决战味道的赛事,也是一个巨大的广告和PR商机,但是打挂对商家来说很讨厌,对普通观战者来说也很烦闷。这些细节需要work out.6 h: z: r2 ^% ^3 L. o- y' b+ `3 v8 D0 F

    , L, {  P) f: v$ P7 M! n另外,CPU很便宜,古狗之所以只用了几千个而不是几万个,几十万,几百万个,是因为增加CPU对提高速度已经没有帮助了。distributed computation的前提是你的整体信息可以在某个维度上做切割。如果你的信息最大限度只能切割成五百块,那么你上1000个CPU就是浪费。7 B. v) M( S3 a8 `' D& D  g

    - H$ [  B' m# ?$ C' u4 _/ q阿法狗如果想继续提升速度(它现在的速度已经明显比李世石快了),唯有依靠算法的提高,也就是价值体系的进一步优化。比如,遇到一个棋型,现在它的价值体系首先要从天文数字的应对方案中遴选出8种来,再对这8种做深度推演。如果未来的价值体系可以从8种降到4种,只对这4种做推演,那样就可以算得更快了

    点评

    涨姿势: 5.0
    涨姿势: 5
    原来如此  发表于 2016-3-10 22:14
  • TA的每日心情
    郁闷
    2022-6-19 00:00
  • 签到天数: 2264 天

    [LV.Master]无

    5#
    发表于 2016-3-11 09:48:40 | 显示全部楼层
    史老柒 发表于 2016-3-10 09:56
    0 p% L& Y7 Z5 O+ e3 V阿狗和樊麾对弈第五局第154手阿狗跟对方互相提劫玩来着。

    7 ?; ^/ F8 a9 z* {前面有一堆人说阿法狗不会打劫,现在都跑哪儿去了?另外爱坛的国手呢?@夜观天象 @胖得妙不可

    点评

    还有一局,阿狗和樊麾有两局都有提劫的棋。但是阿狗处理劫争的水平可能不高。  发表于 2016-3-11 13:03
  • TA的每日心情
    郁闷
    2022-6-19 00:00
  • 签到天数: 2264 天

    [LV.Master]无

    6#
    发表于 2016-3-11 10:59:16 | 显示全部楼层
    本帖最后由 煮酒正熟 于 2016-3-10 22:00 编辑
    & A* C" |' q8 W4 {  G
    删除失败 发表于 2016-3-10 20:36
    7 f3 h" z, J. d# A您的回复让我有了一个想法,
    9 N+ H2 l. u4 Z7 |& h4 o# f3 r8 o
    5 I/ e, R& ]9 g5 ]' B3 s1 d. m, X+ G阿法狗的深度学习神经网络是不是可以理解为回归分析,基础数据是人类的棋谱 ...
    " T  m# F1 S+ |& U
    3 N. w, q; O( n! ?* v
    阿法狗到底是怎么回事,我也不十分清楚,只根据我的猜测胡乱说两句吧。
      {; ]# y$ `7 C; [6 c6 e/ x传统棋类AI的基础是蒙特卡洛树型搜索 (Monte Carlo Tree Search). 阿法狗自然也有这个。但这个是很低级的计算方法,不是高级算法。阿法狗算法里面的高级部分是价值网络和政策网络,这两个东西合在一起,就是要模仿人类棋手的“棋感"。价值网络和政策网络负责掌控宏观形势,基于对宏观形势的研判,指挥蒙特卡洛做有限的树型搜索。注意有限两个字。如果没有价值网络和政策网络的宏观指导,光靠蒙特卡洛树型搜索去下棋,以围棋10的170次方的近乎无限种的应对方式,阿法狗一步棋会下到地老天荒。6 M9 x: n, j7 d0 {& g# a# S5 _
    ; o  M7 D2 C+ l3 Q* ~9 ~
    价值网络和政策网络的技术基础,是很高端的所谓深度神经网络技术。这个俺不懂,就不乱说了。1 J" k6 L+ L8 S! {/ r" h
    , O7 Q0 ?% `4 ?. ^$ C9 {
    说到底,阿法狗之所以下起棋来比较像人,就是因为它有着相当复杂精妙的价值网络和政策网络。它在实战中的应对之所以屡屡技高一筹,得益于大数据时代的软硬件(比如cloud computing,你说它是硬件还是软件?)
    * d" ^9 M* I0 y) Z$ D  Y$ K/ z5 h' J) R1 k
    至于你说的布局方面要打破常规,我觉得最大的可能是被狗狗直接识破并干翻。狗狗从一出生,喂给它的就是职业高手的应对之法,一开始也许是囫囵吞枣知其然不知其所以然,但训练久了,它就逐渐明白什么是假招儿虚招儿了,也就是说已经知其所以然了。就算你玩儿什么百花错拳,妄图乱拳打死老师傅,最多也就只能赢它一盘,甚至连赢都赢不了,只能暂时抢到一些优势。长久来说,百花错拳完全无用。# L7 S0 s5 `$ f+ D% o( w+ Z, H
    # l% W1 {& w1 T( K: B5 B% d" L4 f

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2024-5-15 13:59 , Processed in 0.063185 second(s), 19 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表