设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
12
返回列表 发新帖
楼主: 沉宝
打印 上一主题 下一主题

[信息技术] DeepSeek R1全参数模型一个可能的本地部署方案

[复制链接]

该用户从未签到

21#
 楼主| 发表于 22 小时前 | 只看该作者
大黑蚊子 发表于 2025-2-21 14:10
' Z" d1 F. h% d1 f+ a7 e! k$ V. \我建议你再看一下KTransformers的相关资料
0 N, Y" F) f) U- K这个玩意儿的本质是在低并发(甚至是单并发)的情况下,高度依 ...
+ @/ T* M4 ~9 N0 y
欢迎讨论。8 m; {0 ^! A9 N+ L; W  A" j
/ G- L: i/ q7 j$ Y* y
首先,个人以为KTransformers的最核心最精华的是抓住了DeepSeek模型参数的稀疏性。DeepSeek是基于MoE的,回答某一个具体问题时只有部分参数高度活跃。KTransformers可以动态调度,把这部分高强度计算交给GPU(好钢用在刀刃上),剩下的则由CPU完成。所以CPU部分对系统整体性能的影响不如GPU大。作为佐证,上一帖我提到了章明星团队在几次版本迭代更新之后才把amx加速添加上去。5 v+ z5 ^6 v: R" K8 `5 F
$ Q1 q8 j9 l( p; S2 }( ]8 f* ?9 i
CPU/DRAM带宽对系统性能的影响不是简单线性的。老实说,我没有咱们现在讨论的这样大的系统的实际经验。我只能根据在台式机上看到的现象做一些外推。Intel的12代和13代同时支持DDR4和DDR5,DDR5内存下整体成绩要比DDR4好一些,不过差距并不大。至于到显卡的带宽,我也可以说一点。我们知道目前大部分显卡的插座都是PCIe×16。外置显卡时,因为各种原因往往不做16路通道,比方说仅仅实现了8位通道。那么这个PCIe×8的显卡游戏性能下降多少呢?绝对在30%以内,常常也就10-20%。
- i- O, z" e. g& F3 B0 H" O5 l: i5 K+ s/ y$ d- L7 i
以上这些是我没有简单照搬章明星团队的配置,而为省钱做了一些变更的原因。
回复 支持 反对

使用道具 举报

手机版|小黑屋|Archiver|网站错误报告|爱吱声   

GMT+8, 2025-2-22 23:00 , Processed in 0.034145 second(s), 23 queries , Gzip On.

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表