设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 1982|回复: 20
打印 上一主题 下一主题

[信息技术] 附议xiejin77兄:大模型加海量数据只是超级刷题大师

[复制链接]

该用户从未签到

跳转到指定楼层
楼主
 楼主| 发表于 2024-10-17 12:15:03 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
多谢xiejin77兄好文(http://www.aswetalk.net/bbs/foru ... read&tid=160739)。想了一下,有点感想,请不吝赐教。/ c' K6 k. S4 K$ h  j

2 W& u! ?2 v0 ~$ U/ W1 R个人认为,大模型没有奥秘,还是靠模型参数之多来更好地“捕捉”现有知识的量变,而不是产生智慧的质变。知识依然来自海量的数据,也就是人类世界的现有认知。
( h! v7 t$ f" P% ?. V* }
# p2 }9 M- P* H3 q大模型加海量数据依然在本质上是超级刷题大师。比“查表”式的直接找答案要高级,能填补现有数据之间的空隙,但不能跳出现有数据所代表的知识的框架。在本质上,刷题能解决的,大模型最终都能解决。刷题解决不了的,大模型最终也解决不了。刷题也不是直接照搬解题,还是要判别题型不是嘛。
$ {# ^" _, E1 }0 F: L: a8 w% }6 Y7 R7 l0 a* k" I
世界上的“题”已经够多,所以海量刷题是能刷到很恐怖的“智能水平”的。但依然只是超级刷题大师。沿着这条路走下去,不可能走出创造智慧、具有独立判断的“强人工智能”的。大模型“有创造力”的印象来自吟诗作画,但不是还有“熟读唐诗三百首,不会写诗也会诌”吗?画画也是一个意思,只是从文字介质换成图像介质。9 k0 `5 L7 S! O0 t/ M# |- l( u

; U7 D5 H4 j* y! v; M/ X$ R用围棋规则自我训练是另一个问题。那是有限空间里确定解的问题,是极大规模的最优化问题。在本质上,这与“深蓝”早年打败卡斯帕罗夫相似,只是算力极大提高了,算法极大改进了。8 h# V, H( G7 q9 ^; v2 n; a! e
) g! B$ o/ G2 _7 m9 K
这对中美的AI大赛意味着什么呢?
8 F" n. R- l1 S& ]) S" z! D2 _; L2 \! f0 {+ h* j) _
AI的最终用武之地是在应用,应用型的AI的厉害来自数据,实践才出数据。
+ Q  |+ S4 ?$ @  X4 m
+ M, O3 Y9 N4 ~7 o  h: h在军事、艺术这些方面,美国有足够的实践,美国AI会很厉害,可能超过中国。必须说,中国军队打仗没有美国多,中国影视没有好莱坞能折腾,音乐、美术等也是一样。
0 x. d0 |2 g' K' {: {. F( q
$ w& {# x4 b* }' l( J: G但中国人在制造、建设、物流这些实体方面的实践更多,数据丰富得多。社交媒体和广义通信方面,抖音、微信出现在中国也不是偶然的。个人认为,这些与经济和社会相关的AI应用可能中国会领先,如果不是已经领先的话。
) m% _2 X3 t$ e. e0 I) l+ N0 @. z5 t1 H$ b# [5 X- w2 v: I% a
美国式AI训练凭借算力和算法优势,把天下所有圣贤书、垃圾书统统海灌进去,希望“良币最终压倒劣币”,也因为搞AI建模的人没有能力筛选圣贤书、垃圾书。他们需要的是“通用人工智能”,而没人是能在所有方面都成为专家的。
+ l9 B$ C! U3 O3 w! N+ e8 J# }" {! T1 T9 D8 s, I
中国式AI训练在算力方面吃亏,算法再厉害也输在起跑线上。但中国人有有用的专业知识积累,中国AI也聚焦专业AI,专家参加训练,所以大模型训练时只灌圣贤书,不灌垃圾书,最后在形成有用但专业AI应用方面成绩斐然。
! S& M$ U" _0 r0 r. [7 z/ n- I+ k/ ~/ C5 N
最终,算法、芯片这些都不足以决定性地改变中美AI的走势。

评分

参与人数 6爱元 +48 学识 +2 收起 理由
方恨少 + 12
长叶林 + 8
pcb + 4
tanis + 4 给力
住在乡下 + 6 涨姿势

查看全部评分

本帖被以下淘专辑推荐:

该用户从未签到

沙发
发表于 2024-10-17 20:29:40 | 只看该作者
回晨大牛的话。- J: C- @6 e6 ~) m, c3 I

* x4 `0 c& l5 a8 {/ n; q; `我确知美国至少有一家公司是鉴别反向信息的。他们负责AI的是我的密友。9 k% _. R  R( s
# A0 Q5 E  D/ [# X* s: F
我下面引用他们的话。我先声明我不同意他们的话。
% |) X: D4 x. l( t5 d8 N' P) i2 E0 p
他们的反向信息是中文网络材料。作为唯利是图的美国商人他们对政治不感兴趣。他们这么做的理由是中文网络充满逻辑错误和事实错误。- Y/ P4 U8 }0 N  Y2 h7 ^

9 ^# R( u. i; \+ \* b逻辑错误和事实错误是不可避免的。但是多了不好。咱从自己做起,用事实证明他们走了弯路。
回复 支持 反对

使用道具 举报

  • TA的每日心情
    擦汗
    2025-5-22 23:34
  • 签到天数: 3170 天

    [LV.Master]无

    板凳
    发表于 2024-10-17 23:16:09 | 只看该作者
    宝特勤 发表于 2024-10-17 07:29" w% ~# S' b  h- [- W# z* l
    回晨大牛的话。" }: ?5 u" ]. o  E- W& S/ L) X* J3 m) u

    ( G$ v' r( y6 r我确知美国至少有一家公司是鉴别反向信息的。他们负责AI的是我的密友。
    , I# v7 K8 n# A+ R
    咋感觉你的朋友在缘木求鱼呢。; R  D/ `1 I& k0 j
    众所周知,中文网络的信息量相当小,宽度和深度都不行。这个在几年前就有广泛的讨论。过去几年某种程度上更加是倒退的。掌握中文信息最多是中国政府,第二是国内那些互联网大厂。所以,你的朋友在中文互联网上找内容,感觉完全是门外汉的做法。
    5 ?0 {& }) c* \6 m& q3 X1 v4 R5 H$ n+ d
    这种封闭带来了信息垄断。其好处显然被美国互联网大厂也看到了。于是,过去几年里信息越来越闭塞,爬虫能去的地方也越来越少了,大量信息开始从英文互联网上消失了。这个其实成为堵塞AI后发企业的秘籍。这点上,感觉美帝在向中国学习了。
    5 d6 z: ?0 v# W+ E- t- O4 U

    点评

    油菜: 5.0 给力: 5.0
    涨姿势: 5.0 不能同意更多: 5.0
    油菜: 5 给力: 5 涨姿势: 5 不能同意更多: 5
      发表于 2024-10-18 16:18

    评分

    参与人数 1爱元 +10 收起 理由
    老票 + 10 不能同意更多

    查看全部评分

    回复 支持 反对

    使用道具 举报

    该用户从未签到

    地板
    发表于 2024-10-17 23:29:27 | 只看该作者
    赫然 发表于 2024-10-17 23:164 i* i9 y4 S3 B
    咋感觉你的朋友在缘木求鱼呢。
    ! M, X$ q6 @+ N* |* N1 O6 p. K" U8 d2 C众所周知,中文网络的信息量相当小,宽度和深度都不行。这个在几年 ...

    . R( |3 s; H2 J+ h赫大说得对啊。我朋友不是在中文网上找学习的内容,而是找反面教材。和赫大的观察是一致的。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2021-3-26 09:11
  • 签到天数: 1 天

    [LV.1]炼气

    5#
    发表于 2024-10-17 23:30:32 | 只看该作者
    宝特勤 发表于 2024-10-17 20:292 T1 H4 J" I. C7 a; y
    回晨大牛的话。
    ' i0 T* _' J" l* r  P
    : `0 F: V  a. `, L我确知美国至少有一家公司是鉴别反向信息的。他们负责AI的是我的密友。
    6 m9 X- r4 t7 J+ V9 G* L
    以我大美利坚为例,Truth Social , X, Reddit和TikTok 同主流媒体的区别,让我有了一种平行时空的感觉。: C) y* y1 ~0 Y; n7 a, o

    3 C  F) T; u4 }! o. W; o回到中国,小红书抖音快手,知乎网易豆瓣,同官媒,也肯定不在一个层面上。
    2 e7 N/ J; O8 S) o+ {  S! i3 K. \: N: \4 r. l
    所以逻辑错误或者认知完全不一样都很正常,不宜轻易下结论。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2021-3-26 09:11
  • 签到天数: 1 天

    [LV.1]炼气

    6#
    发表于 2024-10-17 23:32:08 | 只看该作者
    AI在总结现有数据上先天性强于人类,但将AI用于开拓新领域必须小心求证。9 }/ ~" z- B: p# Q- N: A1 k' t

    # ]" Q) r  Y  K  Q+ P我天天用ChatGPT改邮件和论文,但我不相信ChatGPT写的论文。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    7#
     楼主| 发表于 2024-10-17 23:39:30 | 只看该作者
    征久仁 发表于 2024-10-17 09:32
    - K2 S# }  @, R6 V' L6 c2 @' sAI在总结现有数据上先天性强于人类,但将AI用于开拓新领域必须小心求证。; t+ K/ V6 p# o% d' X4 N2 x- L

    1 T7 t0 ?& f& m( a: q# f我天天用ChatGPT改邮件和论文, ...
    / n! v& b6 \- k. S2 e
    AI总结现有数据能力超过人类是自然的,就像雷达、光电红外的“视觉态势感知”好于人类一样。AI的输入通道比人类多太多了,运算速度也爆棚,要刷题,人类是不能拼得过AI的。谁要是无聊到开动AI狂写诗,乾隆都要羞愧。但事实还是一样的:乾隆不是真诗人,AI也不是真诗人。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    擦汗
    2025-5-22 23:34
  • 签到天数: 3170 天

    [LV.Master]无

    8#
    发表于 2024-10-17 23:47:15 | 只看该作者
    晨枫 发表于 2024-10-17 10:39% R+ g$ v( b$ P, H9 b
    AI总结现有数据能力超过人类是自然的,就像雷达、光电红外的“视觉态势感知”好于人类一样。AI的输入通道 ...
    0 U$ N1 |/ a: k, |2 m& D
    感觉AI遇到理论瓶颈了。。。辛顿老先生害怕的超过人类的AI看来暂时还没有影子呢。7 \, f/ V% p' ~, @7 H& s

    ' ^" L3 b, I' x3 S0 s好在AI现在还在进步,等几年看看最后能落地什么。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    9#
    发表于 2024-10-18 01:24:52 | 只看该作者
    宝特勤 发表于 2024-10-17 20:29! _; P* K6 I7 J7 U2 O
    回晨大牛的话。
    2 p6 K& u7 }$ n- f# {+ ~2 M) L+ O! }! Z
    我确知美国至少有一家公司是鉴别反向信息的。他们负责AI的是我的密友。
    * m+ P. z: E" X* ]
    行啊,他们高兴就好。再说他们软件能读得懂多少有高中大学水平的中文?
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2019-6-1 10:07
  • 签到天数: 1 天

    [LV.1]炼气

    10#
    发表于 2024-10-18 02:02:19 | 只看该作者
    宝特勤 发表于 2024-10-17 20:29
    3 U2 }0 X% r. d回晨大牛的话。
    . ?. N3 I$ C. @# ], J+ V3 Q. o6 ~0 r/ }
    我确知美国至少有一家公司是鉴别反向信息的。他们负责AI的是我的密友。
    0 M4 ?1 z$ R7 @* o1 S) b
    不知道你出于什么动机不停的阴阳攻击楼主,也许楼主在别处的罪过你?
    / ~. g5 b, z: U* j1 l/ Q一个整天自诩大公司高管的ID,不停在每个楼里秀你的小肚鸡肠,说怪话,整得像个怨妇似的。
    8 K; y2 h- ?/ B9 t& q
    * m& c6 F" X" F' d# Z6 g劝你呀,还是集中精力cosplay忙总,深度创作傻白甜的职场小作文。那才是蓝海的网络赛道呢。% O9 T" L. ^( v- `

    0 U8 m6 i- n) F  s) C- q, P- J' D你在西西河cosplay忙总,用力过猛,已经被扒的裤衩都不剩了。又跑到爱坛碰瓷晨枫,好不容易积累了一点人设,这么快就要败光了,何苦呢!
    回复 支持 1 反对 0

    使用道具 举报

    该用户从未签到

    11#
    发表于 2024-10-18 02:04:39 | 只看该作者
    yanei 发表于 2024-10-18 01:24
    2 |9 y& Q% f/ g# [9 _行啊,他们高兴就好。再说他们软件能读得懂多少有高中大学水平的中文? ...
    ! l# f1 l$ _/ V
    回yanei 坛友的话。他们软件有中国大学内容啊。我随便问了一下 ChatGPT.  U1 b! m: Y. u# _2 C* s

    2 k& R- n- ~) z) s* }8 v3 u7 w
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2021-3-26 09:11
  • 签到天数: 1 天

    [LV.1]炼气

    12#
    发表于 2024-10-18 02:38:27 | 只看该作者
    晨枫 发表于 2024-10-17 23:397 a& f2 E4 @$ f7 e9 r3 J
    AI总结现有数据能力超过人类是自然的,就像雷达、光电红外的“视觉态势感知”好于人类一样。AI的输入通道 ...
    " L9 y3 U4 S1 i; j  @
    最后一句绝杀了,太牛了

    点评

    章总的残躯在破破烂烂的东陵里面想,为什么又是我躺枪。  发表于 2024-10-18 04:07
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    13#
    发表于 2024-10-18 04:13:52 | 只看该作者
    征久仁 发表于 2024-10-18 02:38
    ! f3 f" ~' m1 ^& U- C最后一句绝杀了,太牛了
    6 V% l# X; Q  l9 w' f, h7 n1 N
    乾隆也是真诗人,首先是真人,其次会作诗,做的水平如何不提,但起码都合格律,就是写得有点多。基本每天一首,总量相当于《全唐诗》共四万三千多首,强烈怀疑他是带着 AI 穿越的。& b4 T9 t, F, d5 D7 y, `1 r
    # a2 G8 S1 p: M3 i( N
    乾隆诗作虽然总体水平不高,但也不乏上品的,毕竟量变还是会带来一点质变的。例如:, ?5 D2 L( U; J. m( H8 g
    1 H8 T$ r8 Y1 b0 l, K
    谁氏园林择胜开,山环抱复水瀠洄。
    / j5 j( z2 ]" s  M川横桥喜路不断,岸转船如峰自回。
    ; A7 X5 |( ~5 F6 m+ \意入敞亭趣有永,目游高阁望无埃。& |$ b7 \5 j. |+ n
    分明层叠浅深处,欲问丹青能是哉?! f3 k9 }! _* A* t* C6 q  d; n

    * R" P8 t: x- \. V6 @0 ]2 [0 v还有这首:/ J' o( y$ v5 B
    三秋别忽尔,一晌奠酸然。6 q% I  N: U7 i, M8 u, p& H! ?
    追忆居中阃,深宜称孝贤。
    4 e$ _- |+ T( s3 Q4 g平生难尽述,百岁妄希延。
    - b( |2 W/ i2 `; T夏日冬之夜,远期只廿年。
    ' @  Y4 L+ p+ {! s8 `$ u/ b  V/ S0 n7 L9 Y# D
    这是乾隆思念亡妻所作,平铺直叙,但情深意切。如果把赋也作为散文体的诗来看的化,乾隆的《述悲赋》也是很好的。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2020-4-8 10:45
  • 签到天数: 227 天

    [LV.7]分神

    14#
    发表于 2024-10-18 11:01:51 | 只看该作者
    感谢晨大翻牌子。) C- l4 ~9 E* c& @8 W( }6 x
    3 |1 c% T# |1 W0 J' J) \; {
    我是金融科技从业者,大模型领域的进化不得不长时间的持续跟进,同时也不得不面对非技术背景的人的询问。甚至是有些德高望重的前辈。
    8 S4 R9 z% C: K! `
    " L  y3 ~' \4 l/ i0 o6 X. fAI这个领域的发展,虽然常有一些意外,但还是跳不出唯物辩证法认识世界的基本观点。- q+ Y4 T7 k9 y# h

    " l. A: M6 o, B晨大的论断,很有一点战略的味道。其实教员同志当年的实践论,矛盾论都是可以拿来理解这些现象的利器。但是国内没有这样的舆论来讲这些话。领域内的只想搞大新闻或者闷声发大财,也米有一个权威来讲讲这些战略上的东西,而用官话套话说这些又显得格格不入。
    2 b. H) ^: n0 N! f- V4 G( f( Q1 K2 h7 F3 p' k5 ?
    所以,舆论的阵地,如果我们不占领,就会被人占领。

    点评

    给力: 5.0 不能同意更多: 5.0
    给力: 5 不能同意更多: 5
      发表于 2024-10-18 11:59
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2020-4-8 10:45
  • 签到天数: 227 天

    [LV.7]分神

    15#
    发表于 2024-10-18 11:03:46 | 只看该作者
    孟词宗 发表于 2024-10-18 04:13
    " U; Z, w7 j, B+ R5 j乾隆也是真诗人,首先是真人,其次会作诗,做的水平如何不提,但起码都合格律,就是写得有点多。基本每天 ...

    % S0 L# d( P3 z5 E) X( N6 I孟老师可以移步诗梦小轩,看看俺的这篇解读http://www.aswetalk.net/bbs/foru ... read&tid=160605
    - d6 K7 D) w9 U- N- d4 |
    7 K$ N0 R& F8 o' r! u/ T5 G( k3 ~作为一个长期有写近体诗习惯的入门者,俺对于AI的近体诗还是有一些体会的。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2021-3-26 09:11
  • 签到天数: 1 天

    [LV.1]炼气

    16#
    发表于 2024-10-18 21:22:30 | 只看该作者
    孟词宗 发表于 2024-10-18 04:13( d' m7 E& B  ^7 f$ ]
    乾隆也是真诗人,首先是真人,其次会作诗,做的水平如何不提,但起码都合格律,就是写得有点多。基本每天 ...
    , ?) @8 ?; g8 b* o
    很多字我不认识
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    难过
    5 天前
  • 签到天数: 1388 天

    [LV.10]大乘

    17#
    发表于 2024-10-19 00:01:27 | 只看该作者
    做中文专家AI系统确实是个好主意。通用AI如果是基于中文互联网确实太难了,污染得太厉害,到处是海量重复和不加甄别的信息,无效甚至有害。

    点评

    给力: 5.0 涨姿势: 5.0
    给力: 5 涨姿势: 5
    行家  发表于 2024-10-19 08:27
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2025-9-17 07:18 , Processed in 0.045383 second(s), 23 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表