吃屎都赶不上热乎的投资圈 - 第2页 - 日志随笔 - 爱吱声

马鹿发表于 2025-2-19 23:45:47

大黑蚊子发表于 2025-2-19 08:28
社长这种富婆一出手肯定没问题啦，只是CPU最近缺货价格比较高
小道消息说Intel后续会对服务器版本的CPU大 ...

对搭建模型没啥执念，更想用api 训练自己的模型，今年特意自学了python，但是没找到deepseek咋付费，国内的人跟我说要找第三方付费。。。

马鹿发表于 2025-2-19 23:46:14

孟词宗发表于 2025-2-19 10:29
如果你现在要搭一个的话，可以考虑下面的配置：
CPU （AMD Ryzen 7 或 9）
RAM 192 GB DDR5 （可以上 256 ...

对搭建模型没啥执念，更想用api 训练自己的模型，今年特意自学了python，但是没找到deepseek咋付费，国内的人跟我说要找第三方付费。。。

马鹿发表于 2025-2-19 23:46:59

xiejin77 发表于 2025-2-19 08:58
可以尝试一下AMD的新品，采用了创新的集成显卡技术，使得它能够利用系统内存作为显存，并且可以根据需要 ...

对搭建模型没啥执念，更想用api 训练自己的模型，今年特意自学了python，但是没找到deepseek咋付费，国内的人跟我说要找第三方付费。。。

孟词宗 发表于 2025-2-20 00:04:07

本帖最后由孟词宗于 2025-2-20 00:08 编辑

马鹿发表于 2025-2-19 23:46
对搭建模型没啥执念，更想用api 训练自己的模型，今年特意自学了python，但是没找到deepseek咋付费，...

没必要的。要训练自己的模型，你照上面的配置搭个机器就行了。如果觉得这还不够，可以上 AWS， Azure 啥的租个机器。

如果只是要用 API，建议你试试英伟达的 NIM https://www.nvidia.com/en-us/ai/Model 在这里： https://build.nvidia.com/ DeepSeek 的 model 在这里： https://build.nvidia.com/deepseek-ai/deepseek-r1

也可以用 Azure, 介绍如下：https://azure.microsoft.com/en-us/blog/deepseek-r1-is-now-available-on-azure-ai-foundry-and-github/

马鹿发表于 2025-2-20 00:13:42

孟词宗发表于 2025-2-19 11:04
没必要的。要训练自己的模型，你照上面的配置搭个机器就行了。如果觉得这还不够，可以上 AWS， Azure 啥 ...

我目前想法是早期读逻辑图后期根据要求生成逻辑图。还有一个就是读图给我生成testcases。这个搞成了，我能把大部分同行干掉。。。很可怕的一件事。。。

隧道发表于 2025-2-20 00:32:39

本帖最后由隧道于 2025-2-20 00:54 编辑

资本与金融必须依附于行业，但是最顶层纯资本与金融圈里能有什么行业，
就算有也是旧行业（模式），根本不会给新行业（模式）投的。
所谓资本懂市场就行，连行业都没有，懂哪个行业的市场？

孟词宗 发表于 2025-2-20 00:58:15

本帖最后由孟词宗于 2025-2-20 01:14 编辑

马鹿发表于 2025-2-20 00:13
我目前想法是早期读逻辑图后期根据要求生成逻辑图。还有一个就是读图给我生成testcases。这个搞成了，...

这个其实很简单。也不需要full size。用8B左右的模型就可以了。你可以看一下 Gemma， Llama 或者 Mistral。主要的挑战不是 Model 本身，而是训练用的资料。

不过，画一般的流程图之类的，现在的 AI 都可以啊。

顺便说一句，各大公司现在搞本地 AI 布置，其中的用途之一就是自动生成各种原始文件。而 IT 赚钱的地方其实不是卖通用 Model，而是拿了 Model 去各大企业根据企业内部资料作 Specialized Training, 然后搞出一个针对性的 Model。初始的建模费用和后续的维持费用是其盈利模式。

马鹿发表于 2025-2-20 02:09:26

孟词宗发表于 2025-2-19 11:58
这个其实很简单。也不需要full size。用8B左右的模型就可以了。你可以看一下 Gemma， Llama 或者 Mistral ...

我就想自己初步做个能用的模型，自己用也方便呀，要是可以卷其他人就更好了。。。

不是流程图，是逻辑图，与或非那种

xiejin77 发表于 2025-2-20 08:13:50

马鹿发表于 2025-2-19 23:46
对搭建模型没啥执念，更想用api 训练自己的模型，今年特意自学了python，但是没找到deepseek咋付费，...

确实，您这个诉求没必要本地搭环境，直接用提供MaaS的厂商服务就行，AWS、Azure都有对应的服务，连IBM都有；国内的可以选阿里云、腾讯云之类的。

但是微调大模型的路径有很多，想用API训练自己的模型，这个思路看起来像是蒸馏模型。这个老实说也没必要用ds蒸馏，直接用gemini也挺香的。

雷声发表于 2025-2-20 08:38:18

xiejin77 发表于 2025-2-20 08:13
确实，您这个诉求没必要本地搭环境，直接用提供MaaS的厂商服务就行，AWS、Azure都有对应的服务，连IBM都 ...

我想搭个自己本地的模型，用公司的codebase训练，然后帮我写程序，方便上班摸鱼划水，不知道可行吗？
这个事情有个显而易见的难处是我们的code都是建立在操作自己的机器，拍眼睛的OCT照片，分析这些照片的基础上的。所以世面上的大模型是不可能有类似的训练的。自己训练的话，一段程序是对还是错得在机器上跑才知道，所以没有机器的训练必定不完整，但是有机器的训练，那就无限接近不可能，因为就算可以把机器的结果反馈回去，时间的成本对于程序来说也是无限漫长了。

xiejin77 发表于 2025-2-20 11:11:44

雷声发表于 2025-2-20 08:38
我想搭个自己本地的模型，用公司的codebase训练，然后帮我写程序，方便上班摸鱼划水，不知道可行吗？
这 ...

您可能不是从业者，基于大模型的自动化编程项目好多，所谓的公司codebase，理论上来说其实也都是通用的程序语言，哪怕是特定的DSL，大模型也能很快明白其中的映射关系。您的诉求大模型能做，软件全生命周期驱动，不算是很大的问题。虽然会有一定的成功率，比如Devin项目。

但是这种自动化编程智能体的设计，是否能取代码农，这就是个见仁见智的问题了。

常挨揍 发表于 2025-2-20 19:40:58

可梦之发表于 2025-2-19 12:35
还是缺钱的，虽然他私募做的很大了，现在也还有几百亿的盘子，但是每年赚的可没有那么多。每年几个亿，十几 ...

可能真不缺，今天又辟谣募资了。
15年以来公司捐款就是2亿多，梁个人捐了6000多万，主要是教育方向。

常挨揍 发表于 2025-2-20 19:48:05

yanei 发表于 2025-2-19 09:25
他那个私募基金曾经管理超过一千亿资金。因为太大碰到了天花板，只好主动减小规模。 ...

限制高频交易缩小规模的。

页: 1 [2]

爱吱声's Archiver