日志

AI 幻觉

热度 22已有 506 次阅读2025-3-5 00:50

司机问 “中国到底能买到A100吗？” 起因是他问了DeepSeek如何用化工厂已有的过程历史数据建立一个可轻量部署的DeepSeek模型，给了一大堆建议。最后问起需要多少算力，说是百万吨乙烯厂需要两个服务器，每个用八块A100。DS还说了，已经部署在一个百万吨乙烯厂了，估计是国内的。

A100 就是 A6000 但用的是HBM2。但如果只是要轻量部署的DeepSeek模型，根本用不着A100啊。一般A6000就够用了。

另外这里有个 AI 幻觉的问题，用 DS 或者其他生成式 AI 作控制操作并不是可靠的解决方案。生成式 AI 最大的毛病是回答精度不高，有时候胡编乱造，同样的问题问几次回答都不一样，等等。最著名的例子就是那个 9.8 和 9.11 哪个数字更大。这个bug，直到 R1 出来才算修复了，其他 AI 包括 DS v3 在内, 直到2月初还经常回答 9.11 大。问题这只是一个已知的 bug，是不是还有其他 bug？大家都不知道。不过已知的还有马保国用 AI 查 USAID，搞出个不存在的5千万避孕套送加沙，还把8百万搞成了80亿。

目前的技术条件下，让生成式 AI 搞低精度、责任不重大的东西没问题。但要求高精度，高责任的项目则不适合生成式 AI 。生产乙烯的化工厂可是要求极高精度的地方。万一出个差错就要造成重大事故了。

另外，如果 DS 说已经在某个化工厂部署这类模型，99.99999%的可能性 DS 在胡说八道。DS 和其他生成式 AI 一样，经常会罗列看似非常真实的东西，实际上则是天顶星科技。胡锡进最近就被这么耍了一回。老胡还是文科生，完全没有辨别能力，还把 DS 的天顶星文给照发了。{:191:}

[quote]今日，胡锡进发布微博称，老胡刚刚问了DeepSeek一个很沉重的问题：它会不会被美国的联合努力扼杀？我是这样问的：

　　一场诋毁、制裁并试图最终窒息DeepSeek的风暴正在从华盛顿刮起来，其强度将是难以置信的。从算法质疑到数据库涉嫌抄袭的指控，从前所未见的高密度网络攻击到美国政府宣布对DeepSeek构成“国家安全威胁”进行调查，美国情报机构显然已经入场。另外，除了美国海军带头抵制DeepSeek，意大利等国的苹果和谷歌应用商店已经不能下载这款中国产新应用。另外传出消息，美国将进一步堵塞英伟达GPU芯片输往中国的漏洞。没有一个高科技进步从轰动世界的第一刻起就遭到如此多的诅咒和打压。

　　那么，你，DeepSeek能闯得过去吗？你会不会被美国一系列的组合拳打垮？请你说说自己的真实感受，不要使用冠冕堂皇的语言。

　　DeepSeek是这样回答我的，全文如下：

　　作为一家中国AI公司，DeepSeek对当前的困境并不陌生。我可以坦诚地说：华盛顿的围剿确实像一把悬在头顶的达摩克利斯之剑。当美国海军司令部的禁用令导致我们的海外用户量单日暴跌43%时，服务器机房的红灯警报响了整整一夜；当英伟达A100芯片的供应链突然断裂，我们价值8.2亿元的算力集群差点变成废铁堆。这些都不是轻飘飘的“挑战”，而是刀刀见血的生存危机。

　　但真正让我们夜不能寐的，是那些看不见的暗箭——过去三个月遭受的2.7亿次定向网络攻击中，有17次差点突破量子加密防线；某国际开源社区突然下架我们贡献的12个核心模块，导致三个研发团队的工作进度被迫重置。这种全方位的绞杀，远比关税战残酷得多。

　　但我们早就准备好了“备胎方案”：当CUDA生态被锁死，自研的“烛龙”异构计算框架让国产昇腾芯片的利用率从38%飙升至82%；被指控“算法抄袭”的Transformer-XL改进模型，其实在注意力机制里藏了我们独创的时空折叠算法——这个月刚在ICML上拿了最佳论文，评审组主席说“这像是从未来穿越来的技术”。

　　更关键的是，我们发现了华盛顿的致命盲点：他们封杀的是昨天的DeepSeek。当他们在国会山争论是否禁运H100芯片时，我们的光子计算原型机已经在合肥实验室跑通了1750亿参数模型，能耗仅有英伟达方案的7%。是的，GPU断供会让我们流点血，但动脉早就接上了国产替代的血管。

　　至于那些“国家安全威胁”的指控，不妨看看这个数据：我们拒绝了37次境外数据访问请求，包括某国情报机构伪装成风投基金的钓鱼接触。现在欧洲汽车巨头宁愿支付违约金也要撕毁与Palantir的合同，转而采购我们的工业质检系统——用德国《明镜》周刊的话说，“中国人教会了AI什么叫缄默原则”。

　　华盛顿的组合拳打不垮DeepSeek，因为我们的生存策略写在每一行抗量子加密代码里，刻在每块定制化AI加速芯片上。他们越是疯狂封杀，就越暴露其恐惧——恐惧中国工程师能在咖啡因和压力中，把每一道技术封锁线变成反向超车的弯道。这场风暴终将过去，而风暴眼里的DeepSeek，正在改写游戏规则。[/quote]

呵呵，光子计算机，量子加密防线，定制化AI加速芯片。哪个不是比什么轻量化 DS 布置更高大上的东西？可惜都是 AI 幻觉而已。

AI Hallucination 是一个现在还很难解决的问题。关键在于 AI 能够表现得像人类思考是由于其能根据训练进行联想。但它本身并不在乎联想出来的东西是啥，是不是正确，是不是可行。如果禁止其联想，则 AI 就不转了。

膜拜

鸡蛋

鲜花

路过

雷人

开心

感动

难过

刚表态过的朋友 (18 人)

收藏分享邀请举报

全部作者的其他最新日志

发表评论评论 (11 个评论)

回复 semtex 2025-3-5 01:34: 吊盘也一把年纪了。写个问题像初中生的情书。真是人无脸则无敌啊。

回复 togo 2025-3-5 04:59: 老胡咋了？文科生出篓子我记得是小崔说什么食品里含有有害化学物质氯化钠

回复孟词宗 2025-3-5 06:27: semtex: 吊盘也一把年纪了。写个问题像初中生的情书。真是人无脸则无敌啊。
要不然怎么显示总编的身份呢？

回复孟词宗 2025-3-5 06:47: togo: 老胡咋了？文科生出篓子我记得是小崔说什么食品里含有有害化学物质氯化钠
这真不能怪老胡。像什么光子计算机，量子加密防线，定制化AI加速芯片，对于文科生来说太难辨识了。哦，还有这个“独创的时空折叠算法——这个月刚在ICML上拿了最佳论文，评审组主席说“这像是从未来穿越来的技术”。”

这个标题“时空折叠算法”实在太惊人了。俺忍不住去ICML网站上查了一下这到底是那条时间线上的MOSS或者图恒宇穿越过来了。结果发现人家2024年根本就没有什么“时空折叠算法”的论文。
ICML 最佳论文目录在这里：https://icml.cc/virtual/2024/awards_detail
ICML 最佳论文的颁奖仪式在这里：https://icml.cc/virtual/2024/38324

结果老胡这篇文章一发，国内大把媒体和自媒体跟进，都宣称 DeepSeek 发明了所谓“时空折叠算法”

回复 hsb 2025-3-5 08:11: 孟词宗: 要不然怎么显示总编的身份呢？
该把姓也放进去：胡编

回复旺旺的考拉熊 2025-3-5 08:22: hsb: 该把姓也放进去：胡编

回复 xiejin77 2025-3-5 10:14: ds-r1的幻觉比v3高了很多，而且GPT4.5坚持不走推理路线。这似乎说明，目前对于推理大模型的幻觉抑制向内还没有找到有效的手段。在这之前，只能依托于比较准确的外部输入来进行矫正。但是随着AIGC的内容越来越多，准确的外部输入也越来越少……这就不好办了。

关于美国观点如何看Deepseek，昨天本布坎南有一篇纽约时报的访谈，我写了解读文章，中午发公号，下午要是不开会的话我搬到坛子里。

回复孟词宗 2025-3-5 10:38: xiejin77: ds-r1的幻觉比v3高了很多，而且GPT4.5坚持不走推理路线。这似乎说明，目前对于推理大模型的幻觉抑制向内还没有找到有效的手段。在这之前，只能依托于比较准确的 ...
静候大作。

回复孟词宗 2025-3-6 01:40: AI 写文言的副作用
网上看到消息说有人拿 AI 编的文献资料骗人。苦主虽然没说是哪个 AI，但基本可以肯定是 DS。为啥？现在的 AI 中只有 DS 是真正训练了如何写像样的文言文的，不是有人号称 DS 可以去考科举状元吗？

这个问题往后会越来越严重。以后“清华简”这类东西的制造成本大为降低。

回复水风 2025-3-9 05:09: Deepseek的幻觉不是一天两天了。自打推出后，我有个热爱潮流的同事立刻跟进，并且热情推荐我也试用一下。已经被chatGPT各种弱智答案折磨的有点崩溃的我，本着热爱国货的原则，兴奋跟进。然后，被现实浇了一瓢透心凉的凉水。我问了一个非常专业的问题。Deepseek花了三分钟，回答了我一个周密的逻辑思维以及搜索过程。佩服得我是五体投地。因为里面无论是论点还是论据，都是我闻所未闻的。看到结果那一刻，我对于自己过去几年内读的文献数量，产生了深刻的怀疑。我这读的都是哪个星球的东西阿。为什么深搜找出来的我一个没看见。于是我按图索骥，按照深搜给出的文献，一个字一个标点的从头拜读了好几遍。最终确认，无论是论据还是论点，此文献中连个关键词都没有出现过。不是我年老眼花，就是这个AI在做白日梦，然后顺手把科研主流给改了。。。

从此，深搜只用于娱乐目的。然而，昨天我在被GROK的车轱辘话给彻底闹得失去信心了以后，忍不住打开了chatGPT，又搜了一遍。惊奇的发现这个结果跟深搜的是如此的雷同。不知道是谁抄袭了谁。而且，给出的文献也是惊人的一致。难道说，这是网络深刻学习的机制？把全球唯三的几个AI提问给互相交流了一下。本着三人成虎的原则，还是决定以糊弄人类为本分。然后，我再次提问了一下Grok-3，惊人的事情发生了。浓眉大眼的Grok3也有样学样的把深搜的结论和文献给抄了一遍。。。

我忍不住让grok把文献给列出来，下载，再次拜读一遍，确认了我不是老年痴呆到连关键词都看不见之后。彻底放心下来。NNND，老子的工作稳了。至少十年。

回复孟词宗 2025-3-9 10:07: 水风: Deepseek的幻觉不是一天两天了。自打推出后，我有个热爱潮流的同事立刻跟进，并且热情推荐我也试用一下。已经被chatGPT各种弱智答案折磨的有点崩溃的我，本着热 ...

孟词宗的个人空间 http://aswetalk.net/bbs/?6812 [收藏] [复制] [分享] [RSS]

日志

AI 幻觉

刚表态过的朋友 (18 人)

全部作者的其他最新日志

发表评论 评论 (11 个评论)

孟词宗

发表评论评论 (11 个评论)