|
不是从 ChatGPT 蒸馏的,但 DeepSeek R1 的确有几个官方蒸馏版。5 {+ G, R2 L. k- u* {
7 u8 ~, J8 {7 e7 z; Y1 A2 A2 q5 R
+ T/ z. H' g( j+ G
6 b# m% C* c5 L, W. ^- k: @! F w% H2 j& l9 u, F; A
从 Huggingface 的 DeepSeek R1 主页介绍(https://huggingface.co/deepseek-ai/DeepSeek-R1) 看,主要是结合了通义千问(Qwen,阿里的大模型)或 Llama (羊驼,Meta 的大模型)
$ C9 O0 c8 s: Y$ r3 c$ P W# N
8 ^! Z p, _( d) t从性能上讲,DeepSeek-R1-Distill-Llama-70B 在六项指标中有五项超过 GPT 和 Claude 的同类模型。而这个模型是可以在个人计算机/工作站的本地运行的。(当然,测试不是在 PC Workstation 上做的)。俺在 local 试了一下,除了文言文和作诗不如在线版本外,基本各项功能都不错。
, P! C" B, T9 v$ R! E$ q. u' {& G7 {' f, {; y6 o% }
|
|