黄仁勋“超等累”!十八路芯片诸侯“围攻”英伟达,谷歌最也许 成功?

摘要

本文泉源:时代周报 作者:朱成呈过去几年,AI算力需求的爆发 让英伟达一度成为最大赢家。但近期多重旌旗灯号 表白 ,这种“单边行情”正在发生变革。行业内部的“抱怨”与资源市场的情绪在同步转向,“天下苦英伟达久

本文泉源:时代周报 作者:朱成呈

过去几年,AI算力需求的爆发 让英伟达一度成为最大赢家。但近期多重旌旗灯号 表白 ,这种“单边行情”正在发生变革。行业内部的“抱怨”与资源市场的情绪在同步转向,“天下苦英伟达久矣”不再是一句戏谑,而成为一段市值波动背后的真实写照。自10月29日以来,英伟达市值在一个月时间里蒸发超7000亿美元(约合人平易近 币5万亿元)。

11月27日,英伟达首创人黄仁勋现身台北。值得注意的是,他向媒体直言“我真的超等累”。

触发这一轮变革的关键,并非传统意义上的竞争对手,而是谷歌。长期以来坚持 低调的TPU蹊径,首次站在了主导叙事的位置。

据媒体报道,举世AI底子办法投入最大的公司之一Meta,正在与谷歌洽商一笔规模可不雅 的芯片采购:从2027年起,筹划投入数十亿美元购买 谷歌的TPU,用于其数据中心。Meta本年的资源支出估计 在700亿至720亿美元之间,这笔潜伏订单的象征意义远大于商业价值 ,意味着行业头部玩家对谷歌AI芯片体系 的认可与验证。

谷歌来势汹汹,英伟达的回手 敏捷而武断 。北京时间11月26日,英伟达公开表示,公司依然“领先业界一代”,并夸张 自己是“唯一一个可以运行全部人工智能模型 的平台,并且可以在任何地方进行盘算”。

英伟达的防御逻辑依然坚固:与谷歌TPU等专用ASIC芯片相比,GPU拥有更优秀的通用性和机动性。在CUDA生态的加持下,英伟达依然把握着最为广泛的开辟者护城河。

但行业的评论辩论 已经转向另一个维度——能效比。AI训练与推理的规模正继续扩展 ,而能耗正在成为新的约束。在同等工艺下,TPU的能效比明显优于GPU,而Gemini 3全程基于谷歌TPU训练的究竟,使这种优势 开端 具备现实意义。

除此之外,一个围绕 ASIC(专用集成电路) 蹊径的新“挑战者同盟”正在成型:Meta、亚马逊、微软、阿里巴巴、百度等云服务厂商,以及博通、寒武纪等一批芯片企业,都在构建面向特定场景的定制化AI芯片。

与此同时,通用GPU阵营也涌现 了更多参与者。AMD、英特尔、海光信息(688041.SH)、摩尔线程(688795.SH)、沐曦、壁仞等公司在连续推出新产物,试图通过体系架构及集群优化提升团体竞争力。

市场对英伟达的见解也在变得更加审慎。从“难以替代”到“存在替代也许 ”,情绪的转向通常先于财产格局的转折 。

这并不料 味着英伟达的主导职位会在短期内动摇。CUDA生态和通用算力优势 依然构成它的核心护城河,但这个行业第一次涌现 真正可以或许挑战的变量:当谷歌能用TPU训练出最前辈 的模型 ,当Meta认真考虑将数十亿美元投向竞争对手时,原来平稳 的结构开端 涌现 渺小裂缝。财产变迁通常就是从这些不易察觉的裂缝开端 的。

谷歌TPU更有性价比

在硅谷,全部的昂贵最终 都邑 输给“够用且便宜”。

投资者之所以从新 评估英伟达的主导职位,很大程度上源于谷歌正在提供一种更具性价比的“AI模式”,依赖功能相对单一但价值 更低的自研TPU,去完成大模型 训练。SemiAnalysis的模型 数据表现,谷歌TPUv7在本钱服从上对英伟达构成了绝对优势 。

TPU是为特定任务(如深度学习中的矩阵乘法和卷积运算)优化的ASIC,通过捐躯通用性,调换极致的机能 和能效。半导体资深专家张国斌在继续时代周报记者采访时表示,“在同等工艺下,TPU 的能效比(机能 /瓦特)远高于GPU。比方,最新一代的Ironwood TPU的能效比是初代TPU的30 倍。”

究竟上,谷歌在这一技术蹊径上的投入已连续十年。从2015年推出第一代TPU起,每一代产物都在机能 、可扩展性与体系服从上不断提升。伴随光互连技术融入TPU体系,谷歌得以在2025年的 TPU v7 上构建凌驾9000颗芯片的超大规模集群。

这种提升并未停留 在谷歌内部生态。OpenAI已开端 使用TPU进行部门训练;Anthropic明确答应将以TPU v5e 作为其下一阶段的大规模训练平台,并夸张 选择情由 是“机能 与本钱的平衡”。谷歌也在自动将TPU网络拓展至中小型云厂商,通过更机动的互助方式降低进入门槛。

其中 最受市场存眷 的,是谷歌基于“硬件即服务”(HaaS)的互助模式。差别于一次性硬件销售 ,谷歌保存TPU的全部权,将装备部署在互助毛病 的数据中心,并按使用量进行分成。华泰证券研报以为,这是一种典范的“游击战式”市场渗出策略;巧妙地降低互助毛病 的capex(资源性支出)进入壁垒,免除新兴和中小型云厂商数十亿美元的硬件投资压力。

此外,谷歌正在打造“算力—网络—模型 —运用 ”全栈体系 (TPU+OCS+Gemini+云服务),实现了从芯片到运用 的深度整合。这种整合使得谷歌可以进行体系级优化,比方数据中心网络拓扑完全为 TPU超节点服务。张国斌以为,跟着 竞争对手的不断进步和市场的多样化需求,英伟达的把持壁垒确实 面对挑战。特别是ASIC(专用集成电路)在特定任务中的高服从和低功耗表现,也许 在某些细分市场对英伟达构本钱色 性威逼 。

单卡机能 紧张性在降落

在单卡机能 上,英伟达仍旧霸占 绝对优势 ,然则 超节点集群的高效连接和体系级优化也许 削弱英伟达在大规模数据中心和云服务提供商中的优势 。

所谓“超节点”(SuperPod),原来是英伟达提出的概念,通过体系级架构创新,将成千上万颗盘算芯片精密耦合为一个高速互连域,以补充传统服务器之间带宽不足、时延偏高的问题。行业在过去一年里大步走向这一方向,速度超出许多人的预期。

谷歌在Google Cloud Next 25大会上正式推出第七代张量处理处罚器 Ironwood,通过其 ICI scale-up 网络,超节点规模可达到9216颗芯片,峰值机能 达到4614TFLOPS,是上一代TPU v5p的10倍。

中国厂商的动作同样辘集 。华为轮值董事长徐直军在9月的公开演讲中判定,超节点已成为大型算力底子办法的主导形态。他泄漏 ,超节点产物 Atlas 950 SuperPoD和Atlas 960 SuperPoD,别离 支持 8192及15488张昇腾卡,在卡规模、总算力、内存容量、互联带宽等关键指标上周全 领先,在未来多年都将是举世最强算力的超节点。

阿里云在2025云栖大会上推出磐久128超节点服务器,依托自研CIPU 2.0 和 EIC/MOC 网卡,单柜即可容纳128颗AI芯片。百度昆仑芯本年4月已在百舸5.0中周全 启用超节点,并实现量产部署。

国产GPU厂商也在加速追赶:曦智科技联合壁仞、中兴推出光互连GPU超节点 LightSphereX;燧原的云燧ESL超节点体系单节点可实现64卡全带宽互联;沐曦的曦云C600支持 MetaXLink 超节点扩展;摩尔线程则以自研KUAE盘算集群,通过5D分布式并行技术实现上千节点协作。

从华为、阿里、百度到“GPU”四小龙壁仞、燧原、沐曦、摩尔线程,国产阵营纷纭 发力超节点。

华龙证券以为,中美AI竞争正从“单卡机能 ”走向“体系级服从”,中国正在用集群建设+开源生态+工程化交付的方式完成AI基建方面的弯道超车。

当AI算力竞争从“芯片之争”转向“体系 之争”。单卡机能 的紧张性在降落,体系服从、能效比、规模化集群交付本领正在成为新的评价尺度。

对英伟达来说,现实既不至于悲不雅 ,也毫不 轻松。英伟达依然拥有最成熟的生态、最强盛的通用算力体系 ,以及行业最广的开辟者底子。然则 谷歌靠TPU打开了一个新的也许 性窗口,云服务厂商的自研ASIC与超节点集群也在连续扩展 影响力。围绕 “够用、便宜、可规模化”,越来越多的变量正在同时发力。

0

路过

0

雷人

0

握手

0

鲜花

0

鸡蛋

推广
火星云矿 | 预约S19Pro,享500抵1000!
本文暂无评论,快来抢沙发!

有招是一个优质的生活妙招创作平台,在这里,你可以任意分享你的妙招经验,日常生活、技能学习、成长励志、恋爱婚姻……我们相信,每个人都有独特的生活妙招,有着无穷的创造力。
  • 官方手机版

  • 微信公众号

  • 商务合作