记者 郑晨烨7月15日,英伟达(NVIDIA)开创 人兼CEO黄仁勋现身第三届中国国际供应链增进 博览会。这已是黄仁勋在2025年内第三次到访中国大年夜 陆,就在几天前的7月9日,他执掌的英伟达,市值盘中突破4万亿美元大年夜 关
![]() 记者 郑晨烨 7月15日,英伟达(NVIDIA)开创 人兼CEO黄仁勋现身第三届中国国际供应链增进 博览会。这已是黄仁勋在2025年内第三次到访中国大年夜 陆,就在几天前的7月9日,他执掌的英伟达,市值盘中突破4万亿美元大年夜 关。 同日,依照 英伟达官方微信"大众," 号发布的信息,英伟达正在提交从新 贩卖NVIDIA H20 GPU 的申请,“美国政府已向英伟达包管将授予答应证”,而且英伟达希望尽快启动交付。H20是英伟达此前“特供”中国市场的一款AI芯片,今年4月被美国政府列入出口管束 。 英伟达在文中同时夸大年夜 了其在美国“增强AI底子办法”的积极,以及在中国“探究AI怎样提高生产力”的意愿。 为“合规”而生的H20H20芯片的出生 配景,可直接追溯至2023年10月17日。 彼时,美国商务部工业与安全 局(BIS)发布了更新的出口管束 最终规则,该规则对销往中国的先辈盘算芯片,设置了两道核心的、量化的技巧 红线。第一道红线是“总体处置处分 性能 ”,用以权衡芯片的综合原始算力;第二道红线则是“性能 密度”,即总体处置处分 性能 与芯片面积的比值,旨在限制 通过芯粒(Chiplet)组合方法 绕开管束 的本事。 这两项指标的设定,将英伟达当时最畅销的H100、A100以及H800、A800等数据中心GPU产品,挡在了中国市场门外。 作为应对,英伟达迅速调解其产品计谋。2023年11月,依照 公开报道,英伟达已开辟出三款专为中国市场筹划的新芯片——H20、L20和L2,其核心筹划目标,就是严酷遵照BIS设定的技巧 参数框架,确保产品合规。其中,作为面向AI训练任务的旗舰型号,H20的公开规格参数,清晰地反应 了这种“合规”的内在逻辑,它与被禁售的H100同样基于Hopper架构(英伟达推出的一种GPU架构),但在关键 性能 上进行了精确的调解。 在算力性能 方面,H20的FP16/BF16(半精度浮点)算力为148 TFLOPS(每秒万亿次浮点运算)。作为比力 ,被限制 的H100芯片在同等精度(FP16)下的算力高达1979 TFLOPS。尽管性能 差距显着,H20的总体处置处分 性能 (TPP)经盘算后低于美国商务部工业与安全 局(BIS)设定的4800 TPP管束 红线,从而到达了“合规”标准。 显存配置是H20少数未被削减的环节,其HBM3显存容量从H100的80GB增至96GB,显存带宽也由3.35 TB/s提升到4.0 TB/s。芯片间的互联性能 ,则是H20最受存眷 的环节之一,其单卡NVLink(英伟达开辟的一种高速互连技巧 )互联总带宽为900 GB/s,与H100的规格持平,这包管了办事 器节点内部的GPU间通信效率。 然而,真正的瓶颈在于跨节点的集群互联本事,由于 美国对高速收集 设备同样存在出口管束 ,中国客户将难以获得用于构建DGX SuperPOD级别集群的NVIDIA Quantum-2 InfiniBand收集 计划 ——该计划 能为每个办事 器节点供应 高达400 GB/s(即3.2 Tb/s)的外部互联带宽。 对于必要数千颗GPU互联以训练大年夜 模子的中国云厂商而言,外部互联本事的缺掉 ,意味着组建超大年夜 规模集群的通信效率将大年夜 打折扣,难度与成本也随之显着增加。 从产品立项到正式获得贩卖答应,H20的问世之路并不平 坦,该芯片原定于2024岁首年月 上市,但其面市时光 一再推迟,市场普遍认为,延迟的缘故原由在于该系列芯片需通过美国政府的额外审核步伐。这漫长的等候,直至2025年7月15日英伟达官方公布获得“包管”,才算告一段落。 “包管”之下的市场挑衅英伟达官方信息中“包管将授予答应证”的表述,在商业层面意义重大年夜 ,它为英伟达在中国市场启动一系列商业运动供应 了必要的底子,这意味着,英伟达可以正式与中国客户就H20的贩卖进行谈判 、签订意向订单、进行产能计划 和供应链预备。 与此同时,英伟达也亮出了其多产品计谋的另一环。英伟达在官方"大众," 号的文章中同时公布,将推出一款“全新且完全兼容”的NVIDIA RTX PRO GPU,该产品“是为智能工厂和物流打造数字孪生AI的理想选择”。 在高性能 盘算芯片受限的配景下,转向工业AI应用 领域,不但相符 中国推动 制作 业升级和“新质生产力”发展的宏不雅 政策标的目的 ,也因其应用 场景的特殊性,面对相对较低的出口管束 风险。数字孪生、工业自动化等市场,或将成为英伟达在中国寻求更稳固业务的突破口。 然而,无论是H20的“有条件回归”,还是RTX PRO的“新路开辟”,都无法回避 一个已然转变 的市场现实——猛烈的本土竞争。 在美国出口管束 政策的窗口期内,中国本土AI芯片产业获得了加速发展的空间。 最直接的表现是市场份额的变革。依照 TrendForce集邦咨询2025年5月发布的一份研究报告,中国AI办事 器市场估计 外购英伟达、AMD等芯片比例会从2024年约63%下降至2025年约42%,而中国本土芯片供应商在国有AI芯片政策支持下,预期2025年占比将提升至40%,几乎 与外购芯片比例中分秋色。 另依照 国际数据公司(IDC)发布的《中国半年度加速盘算市场(2024上半年)跟踪》报告,2024年上半年,中国加速办事 器市场规模到达50亿美元,同比2023上半年增加 63%。在这一高速增加 的市场中,一个关键 的变革是,由NPU、ASIC等非GPU芯片驱动的加速办事 器市场规模增速高达182%,到达近7亿美元。 从更底层的加速芯片角度看,这一趋势同样显着。IDC数据表现,2024上半年,中国加速芯片的市场总规模凌驾90万张,其中,中国本土着土偶 工智能芯片品牌的出货量已接近20万张,约占整个市场份额的20%。 值得注意的是,在办事 器厂商层面,2024上半年按贩卖额盘算,浪潮 、新华三、宁畅等本土厂商占据了市场凌驾70%的份额,中国本土的办事 器供应链正在与国产AI芯片加速深度绑定,构建起相对自力 的生态体系。 IDC中国AI底子架构分析师杜昀龙在报告中认为,由于 前期的大年夜 量采购,目前中国的AI办事 器市场仍处于“存量市场”状况 ,这为本土技巧 的升级供应 了肯定的“缓冲期”。他亦指出,在当前环境下,跟着 行业大年夜 模子需求的不绝加深,“适配中国算力办法的生态创建将成为重要的着力 点”。 一个标志性的商业案例,则更直不雅 地反应 了本土AI芯片产业加速发展的趋势。2024年5月,中国移动公示了其《2024年至2025年新型智算中心采购》项目的中标效果,该项目共计采购人工智能办事 器7994台,总金额高达191亿元国民 币(不含税)。依照 公开的中标信息,分享这一大年夜 单的办事 器厂商包罗昆仑、中科可控、宝德、长江盘算、超聚变、百信、华鲲振宇等。一个关键 的细节是,这七家中标厂商,均为华为昇腾生态体系内的硬件相助同伴,此次招标的技巧 蹊径几乎 被昇腾体系“全包”。 在市场需求最旺盛的互联网行业,头部云厂商也均用现实行动完成了对国产化AI底子办法的结构。依照 华为昇腾官方公布 的信息,其AI硬件平台已对阿里巴巴的全系列“通义千问”大年夜 模子——从70亿参数的Qwen-7B到千亿参数的Qwen-72B——实现了全面适配与深度优化;百度智能云通过其“千帆”大年夜 模子平台,为用户供应 了将文心大年夜 模子一键摆设至昇腾硬件的选项;腾讯云也已将其“混元”大年夜 模子与昇腾办事 器相团结,面向政企客户推出办理计划 ;科大年夜 讯飞的“星火”大年夜 模子更是最早完成与昇腾平台适配的企业之一。 也就是说,英伟达“H20”此次重返市场,面对的已不再是一个对其高度依赖的空白 地带,它不但必要向客户表明其“合规”后性能 参数的削减,更必要面对在价值 、办事 以及生态协同上都极具上风的本土竞争者。 此外,对于已经投入大年夜 量资源进行国产化AI底子办法适配与软件生态创建的中国客户而言,是否乐意以及在多大年夜 水平上“重返”英伟达的技巧 体系,也将是一个庞杂 且艰巨的商业决议。 |
2025-05-03
2025-03-05
2025-03-05
2025-02-26
2025-02-26