TA的每日心情 | 擦汗 2026-3-17 22:01 |
|---|
签到天数: 1133 天 [LV.10]大乘
|
沉宝 发表于 2025-2-22 00:10% `' V% n v+ U! m, M1 w' y
欢迎讨论。
! P$ V/ M6 p( N" I, E" T
, n' ?( j) O* e8 |首先,个人以为KTransformers的最核心最精华的是抓住了DeepSeek模型参数的稀疏性。DeepSeek ... 5 M, V" m: u4 r+ [& M+ ?
刚刚看到一个案例,有个朋友用2686V4 x2 加256GDDR3跑起了671B的Q2.51版本$ A! Q/ v6 P2 S( d ]3 j
显卡用的是3070M 16G,环境是Ubuntu 24.04.25 n5 j( n2 z K
输入大概是10不到一点,输出大概是5,勉强可用
5 W! r. H" p: w% v因为都是整的垃圾配件,总体的成本大概不到4000人民币
" _1 l/ a0 q( D- a. T% V/ X+ P' f$ |7 B9 J2 n2 F
我估计如果他能够用DDR4+至强的话,应该可以到7-8的输出
' Z3 q. K, O7 j2 ], v3 |1 h如果是这个速度的话,个人轻量使用已经没有特别大的问题了 |
|