该用户从未签到
大黑蚊子 发表于 2025-2-21 14:10" h% l2 q( G. i, p( E: p Z$ G 我建议你再看一下KTransformers的相关资料! p# S8 @8 @' O4 X 这个玩意儿的本质是在低并发(甚至是单并发)的情况下,高度依 ...
使用道具 举报
签到天数: 1128 天
[LV.10]大乘
沉宝 发表于 2025-2-22 00:10 + u. h8 G# \. v ]欢迎讨论。/ L7 B) M8 v+ q) y' R1 Q 4 G( O6 |) T; O7 T% p; v 首先,个人以为KTransformers的最核心最精华的是抓住了DeepSeek模型参数的稀疏性。DeepSeek ...
签到天数: 1844 天
[LV.Master]无
大黑蚊子 发表于 2025-3-10 22:25 2 P9 t7 ^; ]* z' O7 @; `% U刚刚看到一个案例,有个朋友用2686V4 x2 加256GDDR3跑起了671B的Q2.51版本- o! L" M5 H% _/ E: V 显卡用的是3070M 16G,环境是U ...
大黑蚊子 发表于 2025-3-10 22:25 6 E" | _$ J3 W- L刚刚看到一个案例,有个朋友用2686V4 x2 加256GDDR3跑起了671B的Q2.51版本 8 q( O/ H* E. x4 c. T: M8 O$ u, f/ ~$ V显卡用的是3070M 16G,环境是U ...
数值分析 发表于 2025-3-10 23:42 F7 f& f9 G3 n" o- p- D' f这里有篇文章是谈万元以下服务器部署DeepSeek-R1 671B + KTransforme的9 ~1 C, s% \$ p) D9 o/ a% ^ https://www.pmtemple.com/academy/ ...
手机版|小黑屋|Archiver|网站错误报告|爱吱声
GMT+8, 2025-3-26 09:28 , Processed in 0.033673 second(s), 16 queries , Gzip On.
Powered by Discuz! X3.2
© 2001-2013 Comsenz Inc.