最新消息,英伟达H200大概要解禁了。12月8日,美国总统特朗普体现将答应英伟达向中国等市场的「经答应客户」出口H200 AI芯片,并称该支配 将附带国度 安全前提 ,由美国商务部落实详细审批与细则。特朗普还提到美国将从
|
最新消息,英伟达H200大概要解禁了。 12月8日,美国总统特朗普体现将答应英伟达向中国等市场的「经答应客户」出口H200 AI芯片,并称该支配 将附带国度 安全前提 ,由美国商务部落实详细审批与细则。 特朗普还提到美国将从相关对华H200买卖营业 中收取约25%的收入分成,这算盘打的噼哩啪啦响。 先不管这事儿后续会如何 ,我们今天 就来扒一扒,为什么看起来很牛的H200,却是最生不逢时的一代。 其实,在这张内外 ,H200是处境最难过 的。 虽然 从技能参数上看,H200是H100的“完美进级 版”(算力持平,但显存和带广大 幅提拔),但在实际的市场占有率和声量上,H100依然霸占 统治职位。 这背后的原因并非H200不好,而是它处于一个难过 的中间职位 。 1. H200生不逢时这是最核心的原因。 前有H100先发:H100于2022岁尾 /2023岁首年代 开端 大规模 交付,当时正是 ChatGPT爆发 、环球疯抢算力的动身 点。险些全部的大公司(Meta, Microsoft, OpenAI)都在那个韶光 窗口创建了巨大的H100集群。 后有Blackwell追兵:当H200终于在2024年中期开端 铺货时,英伟达已经发布了下一代核兵器 Blackwell (B200/GB200)。 对于很多大厂来说,既然手里已经有几万张 H100 了,与其费劲进级 到提拔只有1.4倍的H200,不如跳过这一代,直接等提拔4倍的B200。 于是嘛,嘿嘿,H200成了被很多客户「战略性跳过」的一代。 2. HBM3e产能瓶颈H200比拟 H100最大的卖点是采用了HBM3e内存,这是实现141GB显存4.8TB/s带宽的症结 。 HBM3e是其时最新的存储技能,SK海力士和美光在初期的产能良率远不如成熟的HBM3。 可以或许生产出来的有限HBM3e颗粒,大概优先被分配给了利润更高、战略意义更大的Blackwell系列测试,效果导致H200的交付周期比H100更长。 效果,很多急需算力的客户情愿 买现货富足的H100,也不愿排队等H200了。 3. H200定位偏科H200的进级 重要在显存。 如果干推理,H200堪称神卡。由于大模子推理最吃显存带宽,H200比拟 H100能带来近乎翻倍的推理机能 提拔。 然则 如果搞巡礼,虽然 也吃显存,但更吃核默算力。而H200的计算核心和H100是千篇一律的。 对于那些重要任务是「炼大模子」的公司,H200在核心练习速度上并没有质的飞跃,进级 动力不足。 4. 能同构没人会异构智算中央不是积木,其实换卡很贫困。 练习大模子请求 几千张卡必须机能 划一,你没法在一个全是H100的集群里任意插几张H200,这内里好比木桶道理 ,速度会被慢卡(H100)拖累,H200的额外显存和带宽无从发挥。 异构虽然 是个筹划 ,但那都是缺卡凑卡的无奈之举,为了坚持 集群的同构性,已经在用H100的客户扩容时,只能无奈继续买 H100,而不是买H200。 这么说吧H100像是首创 者,吃到了大模子爆发 的第一波最大红利。 B200则是储君,是各人都在等的下一个真命皇帝 。 而H200呢?它是各夹在中间的「过渡者」。机能 虽然 比H100强,但生在了Blackwell即将发布的前夕 ,注定无法像H100那样铺天盖地。 所以所以,H200为什么能解禁?值得琢磨。 |
2025-05-03
2025-03-05
2025-02-26
2025-03-05
2025-02-26