日志

DeepSeek解题初体验

热度 24已有 440 次阅读2025-2-20 10:10

昨天试了一下DeepSeek的解题，用的是腾讯元宝的接口，确实很惊艳。

我的初始输入是：写一个python程序，随机输出20个数，这些数的范围是0-100，这些数的平均值是71.5。

DeepSeek很快给出了一段python代码并附上了推理过程。

然后我改变输入：我现在改变一下20个数字的取值范围，是10-40，请输出python程序。

DeepSeek的反馈让我有点吃惊。

“好的，我现在需要帮用户解决生成20个随机数的问题，范围改为10-40，同时平均值要是71.5。不过这里有个矛盾，因为10到40的平均值最大只能是40，而用户要求的平均值是71.5，明显超出了范围。所以首先我得确认用户的需求是否有误。

用户可能是在之前的提问中已经设定过平均值为71.5，但当时范围是0-100，现在修改范围到10-40，但没注意到平均值无法达到71.5。这时候应该指出这个矛盾，并询问用户是否需要调整范围或平均值。如果用户坚持要同时满足这两个条件，那么这在数学上是不可能的，必须明确告知用户。”

然后DeepSeek给出了两个修正方案，解决了我的问题。

让我吃惊的是DeepSeek的推理反馈。我打引号的这一段说明DeepSeek似乎不完全是语言模型，它能真正在数学意义上进行推理。

此外，我之前回孟词宗的贴子里，回应了孟词宗提到的一个测试。

就是给定规则：A->B, B->C, C->D,然后以此类推。

如果输入是：ZZZZZZZZZZY，输出是什么？

我用DeepSeek试了一下，第一次的回答是：
Input: ZZZZZZZZZZY
Output: AAAAAAAAAAZ
在我做了提示后：如果把ZZZZZZZZZZY看成一个26进制的数，那么这个数的后继是多少？
DeepSeek经过了长时间的思考（用时285秒），给出了正确答案：
将 ZZZZZZZZZZY 视为 26进制数的后继（加1后的结果）是 ZZZZZZZZZZZ。

还有值得一提的是，我开始的输入是英文，DS的答复也都是英文。但是当我输入的提示之后转为中文之后，DS的答复就变成全中文了。也就是说DS的思考的框架应该是超越具体语言的东西。

膜拜

鸡蛋

鲜花

路过

雷人

开心

感动

难过

刚表态过的朋友 (22 人)

收藏分享邀请举报

全部作者的其他最新日志

发表评论评论 (12 个评论)

回复伯威 2025-2-20 12:05: 俺也用上元宝DeepSeek了，真香。

回复大黑蚊子 2025-2-20 12:15: 我在元宝上复现了你的这俩问题，得到了基本上一致的答案
我在想这个缓存如果没有清除而是直接被重新翻出来的话，是不是会极大降低提供服务的成本

回复 indy 2025-2-20 12:44: 最后一段，这些AI默认都是回答语言与提问语言一致，这个不是思考仅仅是一个设置

回复唐家山 2025-2-20 14:00: 大黑蚊子: 我在元宝上复现了你的这俩问题，得到了基本上一致的答案
我在想这个缓存如果没有清除而是直接被重新翻出来的话，是不是会极大降低提供服务的成本 ...
我猜DeepSeek的思考元过程是存在它的671b的神经网络和参数中的，每次问问题，它都需要重新思考。只保存缓存应该不会显著降低服务成本。

回复唐家山 2025-2-20 14:02: indy: 最后一段，这些AI默认都是回答语言与提问语言一致，这个不是思考仅仅是一个设置
我的意思是DeepSeek的思考使用的是一种类似于元语言，这个语言既不是汉语也不是英语。当然，我说的“思考”是要打引号的。

回复孟词宗 2025-2-20 14:09: 唐家山: 我的意思是DeepSeek的思考使用的是一种类似于元语言，这个语言既不是汉语也不是英语。当然，我说的“思考”是要打引号的。 ...
AI “思考” 使用的是二进制啊我们看到的语言回答都是原始答案出来后再变为用户使用的人类语言的。而这个“翻译”有时候是不牢靠的。如果 AI 觉得自己“词不达意”，就会在几种语言里来回横跳。训练和参数越少的模型越是如此。压缩过的模型也会如此。

回复唐家山 2025-2-20 14:13: 孟词宗: AI “思考” 使用的是二进制啊我们看到的语言回答都是原始答案出来后再变为用户使用的人类语言的。而这个“翻译”有时候是不牢靠的。如果 AI 觉得自己 ...

回复马鹿 2025-2-20 21:48: 伯威: 俺也用上元宝DeepSeek了，真香。
元宝也是ai？

回复 xiejin77 2025-2-21 07:40: indy: 最后一段，这些AI默认都是回答语言与提问语言一致，这个不是思考仅仅是一个设置
不完全是这样的，可以指定AI用什么语言回答你，但是这个只是输出的现象；本质上说，内部的token预测逻辑有可能并不是对应你提问题的版本的，只是在输出的时候做了转换。

如果这一步没做好，就像号称以多语言著称的大模型，都会有在结果中掺杂输出小众语言的情况。

这个就引出另外的一个话题，除了人机交互，大模型只会用自然语言吗？甚至可以更进一步的思考，具备了足够推理能力的AI必须用人类看得懂的自然语言做推理吗？DS-R1-Zero显然就是个例子，并不是。

也就是说，对于基于概率分布的学习来说，人工智能本质上得到的是统计学的概率。之所以会觉得大模型理解自然语言，是因为在使用的时候做了大量的人类对齐和偏好的强化学习。

做个更实际的设想，如果讲一套完整的闭环反馈控制数据丢给大模型进行微调，也很有可能会得到不错的拟合。那么事实上，大模型就可以作为这个控制模型，构成这个控制系统的主控。

回复伯威 2025-2-21 10:07: 马鹿: 元宝也是ai？
对，元宝是腾讯大模型，现已接入deepseek。
网页版yuanbao.tencent.com ，选择deepseek，用起来和原版deepseek差不多。也可以手机装元宝app，用微信号注册即可。

回复松叶牡丹 2025-2-21 11:22: 确实很不错，现在AI已经越来越少出错了，快乐并焦虑着！

回复唐家山 2025-2-21 15:04: xiejin77: 不完全是这样的，可以指定AI用什么语言回答你，但是这个只是输出的现象；本质上说，内部的token预测逻辑有可能并不是对应你提问题的版本的，只是在输出的时候做 ...

唐家山的个人空间 http://aswetalk.net/bbs/?1830 [收藏] [复制] [分享] [RSS]

日志

DeepSeek解题初体验

刚表态过的朋友 (22 人)

全部作者的其他最新日志

发表评论 评论 (12 个评论)

唐家山

发表评论评论 (12 个评论)