TA的每日心情 | 怒 2025-8-7 11:56 |
|---|
签到天数: 1132 天 [LV.10]大乘
|
沉宝 发表于 2025-2-22 00:10 K3 _; Z! k. e6 z
欢迎讨论。
& B6 k2 `. Y, M% o& H( O. k1 x, `, N3 U, L6 q# x
首先,个人以为KTransformers的最核心最精华的是抓住了DeepSeek模型参数的稀疏性。DeepSeek ...
' w* t d4 N: A刚刚看到一个案例,有个朋友用2686V4 x2 加256GDDR3跑起了671B的Q2.51版本
1 m* u, r/ h9 w显卡用的是3070M 16G,环境是Ubuntu 24.04.2" e* A; m5 l- @( @) f9 F3 H
输入大概是10不到一点,输出大概是5,勉强可用
0 B2 H+ A" T5 K$ K因为都是整的垃圾配件,总体的成本大概不到4000人民币
% Z; w3 W9 B0 C. _0 T3 x5 i, J
Q% m* V5 Q/ U8 v8 T我估计如果他能够用DDR4+至强的话,应该可以到7-8的输出
1 V$ J' ?8 ?: ^2 G如果是这个速度的话,个人轻量使用已经没有特别大的问题了 |
|