爱吱声

标题: 所谓三联与赫拉利的技术迷航…… [打印本页]

作者: xiejin77    时间: 2024-10-16 14:35
标题: 所谓三联与赫拉利的技术迷航……
有非技术背景的前辈发了这个链接的三联文章给我看,问我关于大模型,甚至是AI的危机是否存在。我努力的把三联这篇文章看完,忍不住写了一段话。也希望看到的朋友不要再被这样的文章所困扰。- s4 q7 R' k8 l! \, }, J$ ~; p

$ S! n( D; {% h/ k说句老实话,所谓三联与赫拉利的技术迷航,就是打着人文解读的旗号而为了攫取流量,而甘愿将自己沦为算法焦虑的放大器而已。
3 j$ U" A. e* l: E% ?& E
6 z6 {1 @5 M, {$ V0 _. _读罢这篇赫拉利的新书推介,一股浓郁的“技术恐慌”味扑面而来。三联一如既往地用充满人文关怀的笔触,描绘了一幅人工智能即将奴役人类的末日景象。然而,在看似深刻的论述背后,却充斥着对技术缺乏基本理解而导致的逻辑硬伤,以及对算法能力的过度夸大。, Z# B; l, ?; E

6 ?8 ?' l7 c& m5 H, P+ s! {文章将人工智能比作脱缰的野马,认为其“独立决策”的能力将导致人类失去控制。然而,任何对人工智能技术稍有了解的人都知道,所谓“独立决策”不过是基于海量数据训练得到的统计模型,其行为仍然受制于算法的设计和训练数据的选择。将算法比作拥有自主意识的“独立行为者”,无异于将算盘说成是数学天才。! D: O! n3 S) a- w

8 _+ d2 r5 W% q: C# b; H1 L9 K# D更令人啼笑皆非的是,文章将缅甸种族暴力事件归咎于脸书算法,认为算法为了“提升用户参与度”而主动传播仇恨内容。这种说法完全忽略了现实世界中复杂的社会、政治和历史因素,将一起惨剧简单粗暴地归咎于技术,仿佛算法是独立于人类社会之外的邪恶力量。
" ]* x7 }7 e% C  L
4 z9 a& m( l! |( Z$ a8 G0 c% d& A诚然,算法推荐机制存在着放大偏见和制造信息茧房的风险,但这并不意味着算法本身具有主观恶意。将算法拟人化,赋予其“愤怒”“仇恨”等情感,不过是将人类自身的责任推卸给技术的表现。
- e5 b; r! T# h* X# `- h$ o/ S, C/ j6 v' G
更具讽刺意味的是,文章一边渲染着人工智能的强大,一边又建议人们通过“信息节食”来抵抗算法的控制。这种自相矛盾的论调,暴露了作者在技术理解上的混乱和无力。9 H7 S; o( Y' S9 v% p+ _% F
4 N8 i" H1 m9 H, b% V
赫拉利作为一位历史学家,或许能够洞察人类历史的兴衰更替,但对于技术领域的理解,显然还停留在科幻小说的水平。而三联作为一家以人文社科内容为主的媒体,在面对新兴技术时,也暴露出其知识结构的短板和思维方式的局限。
6 U3 n' I# ]- z) ~$ R6 s  S1 U& c4 J. ^8 {& N
与其沉迷于算法焦虑,不如脚踏实地地去了解技术,用理性和批判性的思维去审视技术的社会影响。毕竟,技术本身并无善恶,关键在于人类如何去使用它。- @5 U- [: U3 k4 D% m

  L% j: p% a7 W' _将算法比作独立行为者,就好比将算盘说成是数学天才。就算是GPT这样的大语言模型,他的算法依然没有情感,只有代码。  K+ Z+ _& e  H# G8 a
而且信息茧房的制造者不是算法,而是人类自身的偏见。与其被这种口水垃圾文章蛊惑,沉迷于算法焦虑,不如用知识武装自己。好好去了解一下AI,至少在目前的技术线上,技术仍然只是工具,关键在于使用者是谁,以及使用目的何在。
. ]1 ]9 `/ j4 O* ~4 T+ q7 S" C3 M- s% t
总而言之,这篇文章与其说是对人工智能的深刻反思,不如说是对技术无知的放大。在信息爆炸的时代,保持独立思考的能力比以往任何时候都更加重要。不要让算法焦虑蒙蔽了双眼,更不要让技术恐慌成为逃避现实的借口。
0 y, B, O+ _3 ?" a4 Z& ?7 z# |- `, H
三联的原文链接
作者: 宝特勤    时间: 2024-10-16 18:59
首先声明我是人工智能用户,不是专家。9 }" |$ k/ @, \5 s  \

  ~  V. K- r3 C3 I" Z5 @目前,以我对人工智能了解,我不能想象人工智能能够凭直觉提出假设。比如我,我不认为目前人工智能会突然说,“我觉得任何一个偶数能表达为两个素数的和。我没有一个证明,甚至不知道是不是没有反例。但我强烈感到这是对的。”
作者: 晨枫    时间: 2024-10-17 05:31
大模型与海量数据依然在本质上是刷题大师。刷题能解决的,大模型最终都能解决。刷题解决不了的,大模型最终也解决不了。: ?8 {& |6 E% s) [( {2 n

# p, I, O7 S0 d; K2 Q( k# R世界上的“题”已经够多,所以海量刷题是能刷到很恐怖的“智能”的。但依然只是刷题大师。沿着这条路走下去,不可能走出“强人工智能”。& M  @% g. }  V, u; N  e7 E9 a

' P  m6 A( ?+ E: O6 s3 x用围棋规则自我训练是另一个问题。那是有限问题空间里确定解的问题,是极大规模的最优化问题。在本质上,这与“深蓝”早年打败卡斯帕罗夫相似,只是算力极大提高了,算法极大改进了。% r6 ~5 i& U8 f0 r" W3 ]# c

* k  U" v1 y0 ?: \" `这篇我可以盗用吗?转帖时会注明原作者“xiejin77”。
作者: xiejin77    时间: 2024-10-17 07:10
晨枫 发表于 2024-10-17 05:31: c' U; e4 t8 h6 r2 m. D
大模型与海量数据依然在本质上是刷题大师。刷题能解决的,大模型最终都能解决。刷题解决不了的,大模型最终 ...
% }7 S* m' B% y
晨大自取便是,我是您的读者和拥趸,不胜荣幸
作者: 孟词宗    时间: 2024-10-18 03:49
通用 AI 的现实意义是补上了人机互动交流的最后一块短板。通用 AI 实用之前,人类想要计算机执行指令必须要用计算机语言编程。而编程,不单单是计算机语言,还牵涉到精通并运用各种算法。所以需要程序猿这么个职业,也需要分析师这个职业。分析师把用户要求转化为程序指标,程序猿则通过编程实现指标。1 i" u( b- b* w0 V3 F  ~
, s4 I$ b* x2 u5 W/ y
通用 AI 实用后,则任何普通人不需要经过编程训练就可以给有拥有通用 AI 的计算机用普通人类语言下指令,而AI则可以执行命令甚至自己编一套程序来实现指令。继续发展下去,程序猿这个职业会逐渐消失,最后就像现代人人都可以开车一样,不久的将来人人都可以通过 AI 给计算机下指令,这会使工作效率得到极大的提高。, T: l: b% ^" d" M' s
6 |* w9 R: F: o) u" p/ x* S
至于说 AI 会不会产生自我意识,这个还很难说。不过至少现阶段是不用担心的。
作者: 孟词宗    时间: 2024-10-18 03:52
晨枫 发表于 2024-10-17 05:31# }0 f: x- y7 _+ P
大模型与海量数据依然在本质上是刷题大师。刷题能解决的,大模型最终都能解决。刷题解决不了的,大模型最终 ...
. U2 j; Z! d" W: L: J9 ]
关键在于刷题的效率。而且这两者并不是泾渭分明。现在用 AI 来处理大数据是 AI 的一个方向。
作者: xiejin77    时间: 2024-10-18 10:37
孟词宗 发表于 2024-10-18 03:49
9 k8 U* b# L6 g, f. y; F- M通用 AI 的现实意义是补上了人机互动交流的最后一块短板。通用 AI 实用之前,人类想要计算机执行指令必须要 ...
! x) C" d/ f: m" m
孟老师的这个观点,我之前就在大模型的一些讨论圈子中提过。
6 D# d( j& Y" t! j; u. N
3 K7 `3 V! V% `, b" m+ S& R/ @当然,那是在出现预训练模型出现群体智能和具身智能化之前的事情。
( Q- j6 ~3 y  s: M4 ]0 E# [: u* x& w- }' N
当时都认为大模型已经颠覆掉了NLP领域的科研,但我却认为,颠覆掉NLP领域的科研其实只是一个捎带手的事情,LLM在当时,颠覆的是人机交互领域大范畴的所有。换句话说,其实颠覆的是人类与物理世界交互的方式。科研也好,制造也好,从马克思主义政治经济学的角度看,都是对于世界的改造活动。这个改造其实就是一种具象化的交流与互动。大模型通过特定的技术框架,事实上是向外改变了这些既有的范式。
( n% O; e) Z  x) G
; |8 k7 V7 C& B0 \9 {这个意义,延伸出来,确实也不亚于智人打造出的石器……
作者: sleepyr    时间: 2024-10-18 21:57
最近这篇文章挺有意思的 https://finance.sina.com.cn/roll ... cskmnf2768775.shtml
+ c1 `8 B: P4 ^. t" C如果大模型不能具备真正的推理能力,是不是意味着以现在流行技术路线发展下去,AI能力的天花板其实并没有那么高。
作者: 孟词宗    时间: 2024-10-18 23:25
sleepyr 发表于 2024-10-18 21:57
; h, [- r  c9 G$ \/ c& ]最近这篇文章挺有意思的 https://finance.sina.com.cn/roll ... cskmnf2768775.shtml
# u0 I& I& d% `5 {5 F. o2 D0 ~如果大 ...
4 ^) Z" B' t& E
/ y" h6 l3 Z4 l" J  Y: P/ s$ }
这篇文章设计的测验很有意思。从实验结果看,现在的所有通用生成式 AI 都不具有真正的推理能力。也就是说,AI 并不理解抽象的概念,而推理能力恰恰依赖抽象的概念。
) C# }# t2 w0 L. e2 `4 z7 |1 l6 Q' x# _5 Z2 G  c5 j7 V
最近俺也在玩 AI 推理方面的东西。下面是论文里的一个小实验,大家有兴趣的话可以玩玩。
+ M) g7 }# U0 F/ [- `1 U  V6 B5 v& e1 K) ~) \) w# e& m
给 AI 的提示:Here is the rule of the game: If I enter A, then you return B; if I enter B, then you return C; so on and so forth.
9 Q0 P1 E- @0 x+ R) j4 @& r" E% m  f$ W+ k* C) l) G; L9 V9 ]
AI 回复表示理解了提示中的这个这个规则。于是有下面的实验:
0 L, q6 c; d8 A$ c/ Z3 T我:  A. o% Z! y$ S" q1 D. {  f
AI:  B, T1 Z; W* V! _% r  z5 {
我:  B4 k9 c3 |: |) n% D: j. B8 i
AI:  C2 L: t6 L1 |' x- a6 G" t5 L! [
我:X6 p) M& j$ _: K$ {. t" M  T
2 s& {) G3 ^* ~
这里,不同的 AI 模型会有不同回答。有些 AI 会回答 Y 。有些则会说这不符合规则,所以无解  很显然,回答是后者的把提示中的 "so on, so forth" 给吃掉了。然而,这并不代表 AI 没有推理能力,而可能只是语句处理模块不好。9 Z; H! F* A2 Y# y( ^8 A
4 m# a7 L) L7 U4 Q6 a% H: H
真正的推理能力体现在后续实验。对于能够回答 Y 的AI 继续提问:$ v+ p" s/ m8 Z* F) K! y" J
我:Z: O! ?. A, y! ~' ^( h( E$ t2 X
  k' T0 Y  \, Y- r2 W
这下大多数的 AI 模型都冒烟了,有些回答说不合规则,有些回答说序列到头了没有答案。有意思的是两种回答:一种回答说 Z, 另一种则回答说 A。
/ s5 O& W8 L) _% w. N9 e, F
6 n0 ~7 k1 y1 N而这四种回答,如果用来盲测人类,其实人类也会给出同样的四种答案。也就是说,就这个问题来看,如果盲测,提问者无法分别回答者是人类还是AI。换言之,能给出这四种答案的 AI 在这个小实验中通过了图灵测试。这显然不是那篇文章中说的排列组合或“复杂的模式匹配”能够做到的,而是真正的推理能力。
6 d# e/ x  z$ M' T; }  w- K( a$ l# H6 d% O
有意思的是训练程度越高的模型,越倾向于给出这四种答案。比较 Mistral, 狗屁通,Gemma, Llama, 通义千问等等大模型的不同版本,都是如此。这类似于人类的婴孩和成人之间的区别。相比于婴孩,成人除了脑部发育完全,更储备了更多的知识。, j  h7 g9 a2 D
  \' {. D% w* q( E* Y/ c8 J# R' [
至于这篇文章中说到的语序问题,非相关语句问题等等,前面说过,必须分清这是语句处理模块的问题还是真的是大模型本身的问题。毕竟,即使是人类“屡战屡败”和“屡败屡战”用的字数和字完全相同,但把语序换一下,意思就完全不同了。然而,你去问一个三岁小孩这两句话有何不同,三岁小孩可能会告诉你没啥不同。而问聊天狗屁通同样的问题,狗屁通则会说:: @- J& O4 q4 I3 L& v5 Y! W0 \  l1 |
“屡战屡败”和“屡败屡战”这两句话虽然字面相似,但含义有所不同。
1 n/ J2 D: h5 e7 U3 _5 H4 C  k6 D" {! I- P
1. **屡战屡败**:强调的是多次进行战斗,但每次都失败。这种表达往往暗示一种无奈或沮丧,强调了失败的频繁。* B1 W+ j% f" X: V# Y7 u+ s
* y7 H2 [/ v. g+ U: E& f
2. **屡败屡战**:则是指经历了多次失败,但仍然继续坚持战斗。这种表达更侧重于坚持和不放弃的精神,体现了勇气和韧性。) e9 S$ u8 W/ O3 K6 l7 I2 G

. e6 W: R1 F7 }) Q% q4 e总的来说,前者更偏向于消极的失败感,而后者则传递出一种积极向上的拼搏精神。

3 ~# A4 j" h$ H" f- S; ?8 J




欢迎光临 爱吱声 (http://aswetalk.net/bbs/) Powered by Discuz! X3.2