设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 527|回复: 6
打印 上一主题 下一主题

[时事热点] 英伟达显卡会降价吗?

[复制链接]

该用户从未签到

跳转到指定楼层
楼主
 楼主| 发表于 5 天前 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 孟词宗 于 2025-4-17 14:54 编辑

今天美股又跌了。本来到中午基本持平,但架不住鲍威尔跑出来说不看好川总的关税游戏,强调美联储并不急于降息。结果股市应声下降,收盘前道指几乎跌掉一千点,到收盘时勉强回弹了300点。

鲍威尔的发言主要不是为了操纵股市而是为了救美债。声明发布后,美债2年期收益率下跌4.3个基点至3.78%,而10年期收益率下跌4.6个基点至4.28%以下。与此同时,30年期利率下降3.1个基点至4.74%。这是自4月8日以来的最低水平。

美股大跌的另一个原因是川政府又出妖蛾子了,开始限制英伟达向中国出口特供版H20芯片。英伟达15日警告称,他们将面临55亿美元的损失。

H20 说起来是 H100 的阉割版。太监到什么程度呢?H100 比 H20 快6.68倍 (1979 TFLOPS vs 296 TFLOPS)。从内核数量来说,H20 只有 H100 的40%。所以 H20 这个系列号的意思就是 H100 的 20% 的性能的意思。

但实际操作中发现,H20 虽然在浮点运算上的确比不过 H100,但得益于略好的构架和更多的显存,其推理速度反而比 H100 快20% 。也许这才是黄皮衣给其 20 系列号的真正原因?

最主要的原因还是 DeepSeek 在上一代中国特供版的 H800 以低成本搞出了最先进的 LLM 大模型。H800 主要削减了芯片数据交换率,只有 H100 的一半, 而且也没有 FP64 运算功能。所以当时可以合规出口。DeepSeek 出来后,H800 也不行了。现在则连 H20 也要禁掉了。而这笔交易,据说有130万片H20,总价值160亿美元。

从英伟达15日的声明看,貌似有三分之一左右的芯片已经生产出来了。所以才有 55 亿美元损失一说。而断了英伟达这条财路的始作俑者大概率是写这篇文章(https://ifp.org/the-h20-problem/)的智库。

那么已经生产出来的 H20 不能出口中国咋办呢?这个阉割芯片,理论上还不如家用级的游戏显卡芯片。例如 RTX 5090 的 FP32 有 105 TFLOPS,而 H20 才 74 TFLOPS。所以,英伟达卖中国的家用级游戏芯片也是阉割版。而 H20 这种东西老美自己的算力中心是不要的。H100 和 H200 它们不香吗?

英伟达要处理这批砸手里的芯片,大概率会把它们重新包装成中档游戏芯片。所以现在北美市场上英伟达家用显卡一卡难求的局面可能会迅速改善了。居高不下的家用级显卡价格说不定也会回归正常,甚至大削价。这也算出口转内销吧。

评分

参与人数 3爱元 +36 学识 +2 收起 理由
老票 + 12 + 2
landlord + 12 涨姿势
方恨少 + 12

查看全部评分

该用户从未签到

沙发
发表于 4 天前 | 只看该作者
H20的价格得1万刀朝上了吧?啥中档游戏显卡能卖出这个价?
回复 支持 反对

使用道具 举报

  • TA的每日心情
    开心
    2020-4-8 10:45
  • 签到天数: 227 天

    [LV.7]分神

    板凳
    发表于 4 天前 | 只看该作者
    H20 说起来是 H100 的阉割版。太监到什么程度呢?H100 比 H20 快6.68倍 (1979 TFLOPS vs 296 TFLOPS)。从内核数量来说,H20 只有 H100 的40%。所以 H20 这个系列号的意思就是 H100 的 20% 的性能的意思。

    但实际操作中发现,H20 虽然在浮点运算上的确比不过 H100,但得益于略好的构架和更多的显存,其推理速度反而比 H100 快20% 。也许这才是黄皮衣给其 20 系列号的真正原因?

    最主要的原因还是 DeepSeek 在上一代中国特供版的 H800 以低成本搞出了最先进的 LLM 大模型。H800 主要削减了芯片数据交换率,只有 H100 的一半, 而且也没有 FP64 运算功能。所以当时可以合规出口。DeepSeek 出来后,H800 也不行了。现在则连 H20 也要禁掉了。而这笔交易,据说有130万片H20,总价值160亿美元。


    H20是明显的推理卡,拿它来做训练是勉力为之,重点就是能借助H20的多机多卡新架构对冲一些单卡计算能力的不足。但就像我之前讨论过的那样,其实禁的不只是卡,还有配套的封装协议,DGX系列的全面带宽能力和高速网卡之间的适配框架。这些不解决,放开H200,也难堪大用。DS的突破就是在之前的桎梏之内,用工程师的绝顶才智摸索出了替代之路。

    所以我才说,菊厂任重道远,在这个领域,谷歌已经是连新的gemini2.5,带着新的算力卡,和A2A的智能体间协议一起发布了。如果国内没有厂商跟进,又是一个代差将在两年之内出现。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    地板
    发表于 3 天前 | 只看该作者
    我就给老黄一个面子,低价收两块装主板上。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    5#
     楼主| 发表于 昨天 13:32 | 只看该作者
    雷声 发表于 2025-4-18 08:28
    H20的价格得1万刀朝上了吧?啥中档游戏显卡能卖出这个价?

    这是零售价。真正的生产成本和一般游戏芯片没啥区别,甚至可能还低一点。从回本角度考虑,蚊子腿再小也是肉。何况现在一个5070 ti 16GB 都能炒到一千美元。英伟达好好包装一下的话,搞个 5070 ti super 或者 5080 ti 之类的,说不定能卖个2000美元。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    6#
     楼主| 发表于 昨天 13:59 | 只看该作者
    xiejin77 发表于 2025-4-18 09:43
    H20是明显的推理卡,拿它来做训练是勉力为之,重点就是能借助H20的多机多卡新架构对冲一些单卡计算能力的 ...

    国内设计不是问题。H200 用的 5 nm 工艺说起来也不算太大的问题。关键还在于英伟达在这个赛道起步早,搞出了一套生态体系。要不然 AMD 也不会搞不过它。所以封锁也有封锁的好处,华为寒武纪之类的多努力一下。黄皮衣自己也承认华为的芯片并不比 H20 差。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    7#
     楼主| 发表于 5 小时前 | 只看该作者
    xiejin77 发表于 2025-4-18 09:43
    H20是明显的推理卡,拿它来做训练是勉力为之,重点就是能借助H20的多机多卡新架构对冲一些单卡计算能力的 ...

    有人把升腾910C和GB200作了个比较(CM 384 vs NVLink 72)。


    从这个图表看,虽然单卡性能不足,但集群后性能反而超过英伟达。另外华为的CloudMatrix 384超节点技术。通过超节点架构的集群优化如无收敛组网、高速总线互联,实现了多卡协同下的整体性能提升,基于CloudMatrix 384部署的DeepSeek-R1模型,单卡推理性能可达1920 tokens/s,基本接近H100水平。

    这有点像 T-34 vs 虎式了。虽然 T-34 单车性能在绝大多数方面都被虎式碾压,但架不住T-34简单易造,生产速度快而且苏联有全部知识产权。最后苏联用T-34坦克海淹死了德军的坦克部队。

    何况910C并不是发展的终点。

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?注册

    x
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2025-4-22 11:40 , Processed in 0.041061 second(s), 21 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表