马鹿 发表于 2025-2-19 23:45:47

大黑蚊子 发表于 2025-2-19 08:28
社长这种富婆一出手肯定没问题啦,只是CPU最近缺货价格比较高
小道消息说Intel后续会对服务器版本的CPU大 ...

对搭建模型没啥执念, 更想用api 训练自己的模型, 今年特意自学了python, 但是没找到deepseek咋付费, 国内的人跟我说要找第三方付费。。。

马鹿 发表于 2025-2-19 23:46:14

孟词宗 发表于 2025-2-19 10:29
如果你现在要搭一个的话,可以考虑下面的配置:
CPU (AMD Ryzen 7 或 9)
RAM 192 GB DDR5 (可以上 256 ...

对搭建模型没啥执念, 更想用api 训练自己的模型, 今年特意自学了python, 但是没找到deepseek咋付费, 国内的人跟我说要找第三方付费。。。

马鹿 发表于 2025-2-19 23:46:59

xiejin77 发表于 2025-2-19 08:58
可以尝试一下AMD的新品,采用了创新的集成显卡技术,使得它能够利用系统内存作为显存,并且可以根据需要 ...

对搭建模型没啥执念, 更想用api 训练自己的模型, 今年特意自学了python, 但是没找到deepseek咋付费, 国内的人跟我说要找第三方付费。。。

孟词宗 发表于 7 天前

本帖最后由 孟词宗 于 2025-2-20 00:08 编辑

马鹿 发表于 2025-2-19 23:46
对搭建模型没啥执念, 更想用api 训练自己的模型, 今年特意自学了python, 但是没找到deepseek咋付费,...

没必要的。要训练自己的模型,你照上面的配置搭个机器就行了。如果觉得这还不够,可以上 AWS, Azure 啥的租个机器。

如果只是要用 API, 建议你试试英伟达的 NIM https://www.nvidia.com/en-us/ai/Model 在这里: https://build.nvidia.com/ DeepSeek 的 model 在这里: https://build.nvidia.com/deepseek-ai/deepseek-r1

也可以用 Azure, 介绍如下:https://azure.microsoft.com/en-us/blog/deepseek-r1-is-now-available-on-azure-ai-foundry-and-github/

马鹿 发表于 7 天前

孟词宗 发表于 2025-2-19 11:04
没必要的。要训练自己的模型,你照上面的配置搭个机器就行了。如果觉得这还不够,可以上 AWS, Azure 啥 ...

我目前想法是早期读逻辑图后期根据要求生成逻辑图。 还有一个就是读图给我生成testcases。这个搞成了, 我能把大部分同行干掉。。。很可怕的一件事。。。

隧道 发表于 7 天前

本帖最后由 隧道 于 2025-2-20 00:54 编辑

资本与金融必须依附于行业,但是最顶层纯资本与金融圈里能有什么行业,
就算有也是旧行业(模式),根本不会给新行业(模式)投的。
所谓资本懂市场就行,连行业都没有,懂哪个行业的市场?

孟词宗 发表于 7 天前

本帖最后由 孟词宗 于 2025-2-20 01:14 编辑

马鹿 发表于 2025-2-20 00:13
我目前想法是早期读逻辑图后期根据要求生成逻辑图。 还有一个就是读图给我生成testcases。这个搞成了,...

这个其实很简单。也不需要full size。用8B左右的模型就可以了。你可以看一下 Gemma, Llama 或者 Mistral。主要的挑战不是 Model 本身,而是训练用的资料。

不过,画一般的流程图之类的,现在的 AI 都可以啊。

顺便说一句,各大公司现在搞本地 AI 布置,其中的用途之一就是自动生成各种原始文件。而 IT 赚钱的地方其实不是卖通用 Model, 而是拿了 Model 去各大企业根据企业内部资料作 Specialized Training, 然后搞出一个针对性的 Model。初始的建模费用和后续的维持费用是其盈利模式。

马鹿 发表于 7 天前

孟词宗 发表于 2025-2-19 11:58
这个其实很简单。也不需要full size。用8B左右的模型就可以了。你可以看一下 Gemma, Llama 或者 Mistral ...

我就想自己初步做个能用的模型, 自己用也方便呀, 要是可以卷其他人就更好了。。。

不是流程图, 是逻辑图, 与或非那种

xiejin77 发表于 7 天前

马鹿 发表于 2025-2-19 23:46
对搭建模型没啥执念, 更想用api 训练自己的模型, 今年特意自学了python, 但是没找到deepseek咋付费,...

确实,您这个诉求没必要本地搭环境,直接用提供MaaS的厂商服务就行,AWS、Azure都有对应的服务,连IBM都有;国内的可以选阿里云、腾讯云之类的。

但是微调大模型的路径有很多,想用API训练自己的模型,这个思路看起来像是蒸馏模型。这个老实说也没必要用ds蒸馏,直接用gemini也挺香的。

雷声 发表于 7 天前

xiejin77 发表于 2025-2-20 08:13
确实,您这个诉求没必要本地搭环境,直接用提供MaaS的厂商服务就行,AWS、Azure都有对应的服务,连IBM都 ...

我想搭个自己本地的模型,用公司的codebase训练,然后帮我写程序,方便上班摸鱼划水,不知道可行吗?
这个事情有个显而易见的难处是我们的code都是建立在操作自己的机器,拍眼睛的OCT照片,分析这些照片的基础上的。所以世面上的大模型是不可能有类似的训练的。自己训练的话,一段程序是对还是错得在机器上跑才知道,所以没有机器的训练必定不完整,但是有机器的训练,那就无限接近不可能,因为就算可以把机器的结果反馈回去,时间的成本对于程序来说也是无限漫长了。

xiejin77 发表于 7 天前

雷声 发表于 2025-2-20 08:38
我想搭个自己本地的模型,用公司的codebase训练,然后帮我写程序,方便上班摸鱼划水,不知道可行吗?
这 ...

您可能不是从业者,基于大模型的自动化编程项目好多,所谓的公司codebase,理论上来说其实也都是通用的程序语言,哪怕是特定的DSL,大模型也能很快明白其中的映射关系。您的诉求大模型能做,软件全生命周期驱动,不算是很大的问题。虽然会有一定的成功率,比如Devin项目。

但是这种自动化编程智能体的设计,是否能取代码农,这就是个见仁见智的问题了。

常挨揍 发表于 7 天前

可梦之 发表于 2025-2-19 12:35
还是缺钱的,虽然他私募做的很大了,现在也还有几百亿的盘子,但是每年赚的可没有那么多。每年几个亿,十几 ...

可能真不缺,今天又辟谣募资了。
15年以来公司捐款就是2亿多,梁个人捐了6000多万,主要是教育方向。

常挨揍 发表于 7 天前

yanei 发表于 2025-2-19 09:25
他那个私募基金曾经管理超过一千亿资金。因为太大碰到了天花板,只好主动减小规模。 ...

限制高频交易缩小规模的。
页: 1 [2]
查看完整版本: 吃屎都赶不上热乎的投资圈