|
本帖最后由 孟词宗 于 2025-5-25 00:36 编辑
现代CPU,尤其是服务器级别的 CPU 跑大模型理论上是没有问题的。相比 CPU, GPU有更多的内核,可以进行更好的平行处理。但服务器级别的 CPU 的内核其实也不少,基本也够用。实际操作的问题在于内存的带宽跟不上处理速度,结果造成所谓的 Memory Wall。这成为主要瓶颈,所以苹果和英伟达要用 unified/coherent memory 。举例来说,5年前出品的两代前入门级别的 RTX 3060 的带宽可达 360 GBps 。而DDR5-5600 的带宽只有 44.8 GBps。只有 RTX-3060 的九分之一。而最新的入门级 RTX 5060 带宽可达 448 GBps, 正好是 DDR5-5600 的十倍。
解决方案就是增加通道。例如那个丐版双路 Xeon E5 可达八通道。如果是跑 DDR-5600 就基本接近 RTX 3060 的带宽了。但由于其最高只支持 DDR4-2400, 八通道 只能达到 RTX 3060 的一半不到。俺入手的那个 HP Z8 是双路 Xeon Gold 61xx。可支持最高 12 通道,DDR4-2666, 这就达到 RTX 3060 的60% 左右了,再换上两张 RTX 4000 Ada 20GB 显卡,速度也就不错了。如果要降低成本,现在新出的 RTX 5060 ti 16GB 也不错。
如果预算更充足的话,可以上 AMD 的 EPYC 9005 系列 CPU。这个 CPU 支持12通道。如果是双路就是24通道。大多数主板每路可支持 614 GBps。这样单路 CPU 就远远超过 RTX 5060,相当于 RTX 5070 的 672 GBps了。双路可达 1228 GBps。相当于RTX 5080(960 GBps)的1.3倍。四路48通道的话就是2456 GBps,超过 RTX 5090 (1792 GBps)1.37倍。
预算在1万5千美元到2万美元之间的话可以考虑这个方案。不过先说明,这只是理论方案,仅供参考,俺没有实际装过,实际效果怎样不保证。
CPU: EPYC 9115 16-core 现在才$659 美元, 两个 $1,318。
https://www.newegg.com/amd-epyc- ... tem=N82E16819113865
主板(GIGABYTE MZ73-LM0 Rev. 3.x ) $1,196。
https://www.newegg.com/gigabyte- ... VsHSGZnHb2Rx-yPaXNl
内存: DDR5-5600 1.5 TB
A-Tech 512GB (8x64GB) 2Rx4 PC5-44800R DDR5 5600 MHz EC8 RDIMM ECC Registered DIMM 288-Pin Dual Rank x4 Server & Workstation RAM Memory Upgrade Kit
512GB 的 kit 一套 $2,559 ,三套就是 $7677
SSD 硬盘: NVME 4TB PCIe 4.0x4,这个随便在美国买,价钱都差不多,$200 左右。
CPU Cooler:Dynatron J12 AMD Genoa Socket SP5 Copper Heatsink and Active Cooler, 320W x2 https://mitxpc.com/products/j12?gQT=2 , $60 一个,两个$120
电源:1800 W 到 2000 W,美国买的话$600 左右。
机箱:e-ATX Tower, $300 左右。
GPU:RTX Pro 6000 96GB Max-Q $8,500
共计:$19,791
如果预算宽裕的话,CPU可以升级到 EPYC 9335 (https://www.newegg.com/amd-epyc- ... -from-price-options) 单价 $2,768 , 两个$5,536。
总计上升到 $24,009。
网上有卖 CPU+主板+内存套装的。例如下面这个:
https://spwindustrial.com/amd-ep ... Xapnwevz7fnOXQvDf1A
这个用的是上一代的 AMD EPYC™ 9654。单路带宽只有 460 GBps 相当于RTX 5060,但内核更多, 有96个内核共192逻辑内核。
这个卖家的套装价格是 $17,851.99。加上其他配件总计在 $25,000 到 $27,000 左右。
不过俺也没有从他那里买过东西,仅供参考,不保证其质量和信誉。 |
|