设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 1242|回复: 5
打印 上一主题 下一主题

[科技前沿] 中外大模型数学能力比拼

[复制链接]
  • TA的每日心情
    奋斗
    2021-4-20 05:43
  • 签到天数: 300 天

    [LV.8]合体

    跳转到指定楼层
    楼主
     楼主| 发表于 2025-1-26 17:34:23 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 可梦之 于 2025-1-26 17:57 编辑
    2 h/ E: \/ d, Y: P8 V+ J, @- g. N  ]- F" |+ \9 `! R
    遇到一个数学问题,懒得推导了。习惯性让GPT推一下。
    ( \. n( _0 M5 E! g9 y$ @5 Y8 E3 s( X, O( ~; D& k! e
    最开始问题给错了,然后纠正了一下,貌似GPT就鬼打墙出不来了。给的答案也不对。
    7 G" U. y3 l& w# y
    ; C) ~" V; h8 L  h1 J: e
      t* Y5 g! I% |5 m1 g可能受上下文影响。那重开一个对话,结果还是不对。要么说没有解
    0 ?/ x# S) D, t  E. P  v: ]9 u' U1 j5 S( B: f) G* I" f

    6 O) B7 D9 l8 e& M' M$ p% A' b* S6 F0 U! M7 j9 |
    8 P/ r& d' X* B  i# G. \

    8 _1 U9 j! V" a& ^" }要么继续胡说八道。
    / \! ]$ r7 i0 B; g2 d" ]8 D( [  z
    0 ~! U) D# I( ~2 J) @5 N
    抱着试试看的态度,把同样的问题扔给了豆包和deepseek。% k  R; S+ ^9 d  ~1 T- l+ x- u
    1 k' m6 H; L2 X, i9 q& H0 I8 V2 |# `  y
    deepseek速度快,结果也对,但是过程是不对的。8 \" W& O4 Z  o  d
    # A" P" x' p' j' P
    ) D! b+ y9 n2 f
    豆包过程比较绕,但是基本正确,结果也是对的。
    / q; j  s- S3 {# Q0 T, K8 m8 q5 I7 T
    6 p# ^( L- [! c9 a. z4 f
    6 k- U; ^, r4 s当然,都不如人推导的哈。
    9 n! f6 a% V1 r
    : h. f& l* i1 {: ^6 Y+ |' O% E5 _
    过去一年多,算是ChatGPT的深度用户,感觉也不错,一直花钱买VIP。但是对国产大模型用的不多。一方面最开始用户体验不好,一方面自己内心还是有点看不起国内的大模型。内心是不希望ChatGPT输的,所以反复尝试了多次,还是不行。' r2 o  q$ m, z5 w

    & ^3 e' d2 y. W: h* f6 G# v$ {虽然GPT可能被我误导了,换个账号也许就没问题了?虽然这只个例,ChatGPT比国内大模型表现好的多了去了。但却破除了我心中的执念,以后有问题,也会在国内大模型试试了。
    ! z% C7 m, V. A. ^% P) x' o/ c4 @& s2 \  T) O

    8 m% J, J4 h1 r- M' G+ f
    : i, u( l9 z; u$ k1 B0 A. s& i+ K6 J

    ; s8 ~5 r' f- W

    评分

    参与人数 4爱元 +36 收起 理由
    helloworld + 10
    方恨少 + 12
    pcb + 4
    johnsonjian + 10

    查看全部评分

  • TA的每日心情
    奋斗
    2021-4-20 05:43
  • 签到天数: 300 天

    [LV.8]合体

    沙发
     楼主| 发表于 2025-1-26 18:52:01 | 只看该作者
    个人推导错了 落了一个系数2.
    & Z5 v4 S4 B0 H% R( s/ q* }7 @' S6 l6 ]; w+ _6 J! C
    这也是我们需要AI的原因啊
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2 小时前
  • 签到天数: 3601 天

    [LV.Master]无

    板凳
    发表于 2025-1-26 22:43:24 | 只看该作者
    我没用过花钱的AI, 但是我觉得各有优缺点吧。$ o$ K. Y0 L) j: i- ~. a) z
    ' ^1 O* ~' H& M: p# e
    要是用中文问问题, 我喜欢国内开发的, 要是用英语问国产AI我会特意指名用英语搜国外的资源。/ H5 c- i, y# K

    4 H! p' P3 |: q" r, S3 ?) L/ F即使美国的几个AI, 答案也不一致, 我都是一个问题问2,3个AI4 Y0 W; U9 t& }

    + b* S: c. i9 [$ h9 B现在搜索喜欢上了AI搜, 平时看我在用哪个笔记本, 工作上有一个笔记本上有vs code,所以顺手用了copilot;
    ) X3 ?' Q. Q8 o* F; p# r另外的一个笔记本我基本上只常规使用搜。
    ' C* i* H9 G/ I. ~6 A% S' M# I, a6 }- P1 p, G
    我个人的本上装了好几个AI, 经常每个问一下。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    奋斗
    昨天 03:31
  • 签到天数: 2764 天

    [LV.Master]无

    地板
    发表于 2025-1-27 01:55:48 | 只看该作者
    马鹿 发表于 2025-1-26 22:43+ V0 |& F/ A6 H
    我没用过花钱的AI, 但是我觉得各有优缺点吧。
    6 {: d* L, a, m6 V# `# U( Z# b* g$ z& Y' |. s# W
    要是用中文问问题, 我喜欢国内开发的, 要是用英语问国产A ...
    我个人的本上装了好几个AI, 经常每个问一下。

    , ]0 L, Z& P' k( m0 v8 k5 n: y) E! [; Y7 O3 q# r8 f: k3 B! T
    所以到底哪个更好?
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    慵懒
    1 小时前
  • 签到天数: 2394 天

    [LV.Master]无

    5#
    发表于 2025-1-27 03:30:40 | 只看该作者
    Chatgpt数学非常不行。以下是个典型例子:* w0 P: J: I! Z

    4 u) a" T4 E$ i9.11和9.9哪个大) U5 w. \  B) s1 I. x
    ChatGPT said:
    7 W3 U% I& w3 ^ChatGPT5 D! `) ^8 A6 y
    9.11 比 9.9 大。
    6 T5 n3 t5 s$ S
    - D8 w0 S! ~( \; U+ ?9 A$ @$ I原因是比较小数时,先看整数部分:两者都是 9。然后看小数部分,从左到右逐位比较:& X' e! l1 y9 _, R0 h  [

    5 d6 B* F" [6 s& w- x9.11 的小数第一位是 1,9.9 的小数第一位是 9。; _  ?4 [# e! O& a; x1 ~* I0 s
    由于 1 < 9,因此需要继续看下一位。
    6 A& W4 K( h. {& K7 f1 l9.11 的小数第二位是 1,而 9.9 的小数第二位可以看作是隐含的 0(即 9.90)。/ p, j3 p9 Y* {
    因为 1 > 0,所以 9.11 > 9.9。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2 小时前
  • 签到天数: 3601 天

    [LV.Master]无

    6#
    发表于 2025-1-27 03:44:05 | 只看该作者
    方恨少 发表于 2025-1-26 12:55* M8 d. b$ @' V, u
    所以到底哪个更好?

    7 O7 t, T" Y  H4 B# G" Z说不上哪个好,真有要问的问题 都跟个遍, 看看哪个答案适合自己。 就连平时的搜索我都是bing 和google互相验证。
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2025-11-10 03:44 , Processed in 0.029200 second(s), 18 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表