设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 251|回复: 5
打印 上一主题 下一主题

[科技前沿] 中外大模型数学能力比拼

[复制链接]
  • TA的每日心情
    奋斗
    2021-4-20 05:43
  • 签到天数: 300 天

    [LV.8]合体

    跳转到指定楼层
    楼主
     楼主| 发表于 昨天 17:34 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 可梦之 于 2025-1-26 17:57 编辑 * v( a- }+ W( b; P) _5 u

    & S9 i  d0 b% [' Z% w: o1 p遇到一个数学问题,懒得推导了。习惯性让GPT推一下。
    ; I7 R: w1 u0 }4 O( L
    / m8 f) M, B( K  z1 _5 I% o最开始问题给错了,然后纠正了一下,貌似GPT就鬼打墙出不来了。给的答案也不对。8 s+ Z( P3 L% h7 F
    # k  R! [5 p- |1 s( Z3 m

    ) o' D. y% I  {" S可能受上下文影响。那重开一个对话,结果还是不对。要么说没有解* P+ g) q% J7 |: M5 p

    4 U4 n4 n) t/ p8 G, ^; ~5 B" W% b
    " `* s4 }! G( x$ @
    7 e) G& E( C+ u2 H1 j
    " V( l- k  Q) A" _3 ^
    + T% r6 Y6 d. _9 e. Y要么继续胡说八道。
    " t- h0 d* P* d, x& V* E7 m1 v: m5 `) W7 M% O0 V9 i9 V2 t3 W

    $ @7 J9 m7 y, m) O# U7 h% _! w抱着试试看的态度,把同样的问题扔给了豆包和deepseek。" ?* Z1 w; r, S: u

    ! c% Z1 q2 b2 V! H* odeepseek速度快,结果也对,但是过程是不对的。; J. U/ |) O! N" \; |! Y

    9 x$ O. {# |" ]& U; b' M
    $ j+ ?1 Q' {9 t# a4 o豆包过程比较绕,但是基本正确,结果也是对的。8 N; A5 @; G; b; _4 c1 N' D5 H
    " r7 j8 D6 _8 |# D( q5 G! E# N+ C# e

    . u- ]" M) Q4 W( @* x4 Y5 z当然,都不如人推导的哈。
    & ]3 v% \# B8 Q4 r
    " R$ b2 F* t: P5 p% o- ?7 A0 M8 @5 [+ `: X
    过去一年多,算是ChatGPT的深度用户,感觉也不错,一直花钱买VIP。但是对国产大模型用的不多。一方面最开始用户体验不好,一方面自己内心还是有点看不起国内的大模型。内心是不希望ChatGPT输的,所以反复尝试了多次,还是不行。' p  Y0 c3 D/ ~+ Z6 G# q2 s

    + u  D* M) p+ ?/ }2 Z5 z虽然GPT可能被我误导了,换个账号也许就没问题了?虽然这只个例,ChatGPT比国内大模型表现好的多了去了。但却破除了我心中的执念,以后有问题,也会在国内大模型试试了。
    1 v7 j. ^/ v% j7 k6 P5 r2 \3 z% ?) b" x7 E- j3 s

    + S  k* C4 _0 m$ ~4 w5 K: S( }7 Z2 Y" f6 H. m4 e

    : F+ f! _. P8 R, z5 i0 V+ M- Q' X/ u5 l

    评分

    参与人数 4爱元 +36 收起 理由
    helloworld + 10
    方恨少 + 12
    pcb + 4
    johnsonjian + 10

    查看全部评分

  • TA的每日心情
    奋斗
    2021-4-20 05:43
  • 签到天数: 300 天

    [LV.8]合体

    沙发
     楼主| 发表于 昨天 18:52 | 只看该作者
    个人推导错了 落了一个系数2. ! r0 K6 p8 c6 O) w
    " p* W* d$ ~+ P
    这也是我们需要AI的原因啊
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    14 小时前
  • 签到天数: 3344 天

    [LV.Master]无

    板凳
    发表于 昨天 22:43 | 只看该作者
    我没用过花钱的AI, 但是我觉得各有优缺点吧。; A  M6 i/ M- q8 b1 `

      P2 Y; W0 w3 H3 @) Z5 S要是用中文问问题, 我喜欢国内开发的, 要是用英语问国产AI我会特意指名用英语搜国外的资源。
    6 k. P# }: G/ P; W' V
    0 b6 p* v# R: V0 Q即使美国的几个AI, 答案也不一致, 我都是一个问题问2,3个AI
    , m; u) K1 l3 E+ V3 g2 K* B5 s
    * N3 i' [) V5 M! x* {* {6 W现在搜索喜欢上了AI搜, 平时看我在用哪个笔记本, 工作上有一个笔记本上有vs code,所以顺手用了copilot;5 n- d2 e( {' \
    另外的一个笔记本我基本上只常规使用搜。
    3 }6 h3 H) e" y$ g6 R3 p& j3 k8 V; n2 g' V1 |& u1 W8 @" |) u
    我个人的本上装了好几个AI, 经常每个问一下。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    奋斗
    13 小时前
  • 签到天数: 2503 天

    [LV.Master]无

    地板
    发表于 12 小时前 | 只看该作者
    马鹿 发表于 2025-1-26 22:43+ l/ T3 w& S8 B! W, f! ?
    我没用过花钱的AI, 但是我觉得各有优缺点吧。4 m4 F- a& o5 f" i2 z0 T* q/ z

    " O: y4 Z7 M, U5 ^要是用中文问问题, 我喜欢国内开发的, 要是用英语问国产A ...
    我个人的本上装了好几个AI, 经常每个问一下。
    + o9 g1 s, K" B0 m0 q# C! b, @
    6 B2 v4 |$ o9 p* f$ @3 r. F- S2 Z
    所以到底哪个更好?
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    慵懒
    11 小时前
  • 签到天数: 2197 天

    [LV.Master]无

    5#
    发表于 10 小时前 | 只看该作者
    Chatgpt数学非常不行。以下是个典型例子:/ i0 f4 n" l# C9 I, j& Q
      O* |4 R) g) s* l2 p7 i
    9.11和9.9哪个大
    " A& K: y- Z1 q$ v& z- z# `ChatGPT said:
    / I1 ^  A* k0 f/ @ChatGPT7 V$ X/ P" x& v$ Z  r, _
    9.11 比 9.9 大。
    " M* \6 a- Z' G$ g
    - F& T. @* h- Z2 @原因是比较小数时,先看整数部分:两者都是 9。然后看小数部分,从左到右逐位比较:, x- Q. s& I5 A0 Y
    ! J6 b8 `- ?# Q# [, J# o8 e' N
    9.11 的小数第一位是 1,9.9 的小数第一位是 9。" e$ J0 p* B, ?. ?$ Y$ Y
    由于 1 < 9,因此需要继续看下一位。
    5 ]) O* Z+ o) u2 k9.11 的小数第二位是 1,而 9.9 的小数第二位可以看作是隐含的 0(即 9.90)。
    - P+ g' j% I1 {8 G, r& J- j/ U1 I因为 1 > 0,所以 9.11 > 9.9。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    14 小时前
  • 签到天数: 3344 天

    [LV.Master]无

    6#
    发表于 10 小时前 | 只看该作者
    方恨少 发表于 2025-1-26 12:55
    % o$ T: {) Z4 @+ s6 L所以到底哪个更好?
    ) F) B* ?0 Q: X7 L
    说不上哪个好,真有要问的问题 都跟个遍, 看看哪个答案适合自己。 就连平时的搜索我都是bing 和google互相验证。
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2025-1-27 14:06 , Processed in 0.034559 second(s), 19 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表