张一鸣黄仁勋,想到一块儿了

摘要

具身智能现在已成为最火的产业之一,中国行业龙头宇树科技上市正在紧锣密鼓进行,而中美科技巨子 则在水下更深处进行宏大布局。本年3月,在GTC 2025主题演讲中,英伟达CEO黄仁勋演示了挪威呆板人公司1X 的NEO Gamma人

具身智能现在已成为最火的产业之一,中国行业龙头宇树科技上市正在紧锣密鼓进行,而中美科技巨子 则在水下更深处进行宏大布局。

本年3月,在GTC 2025主题演讲中,英伟达CEO黄仁勋演示了挪威呆板人公司1X 的NEO Gamma人形呆板人。这款呆板人运用了基于英伟达GR00T N1模子构建的后训练策略,并实行自主 整顿 使命。

黄仁勋试图以此证明,人形呆板人的未来在于顺应性和学习能力。换言之,呆板人到底行不成 ,关键要看“大脑”能否顺应情况、能否学习新知识。

黄仁勋的话很快应验。几个月后,全球科技巨子 在“呆板人大脑”这件事上拿出了新效果。

8月,英伟达推出Jetson AGX Thor,一块能在呆板人本体上同时运行多个生成式AI模子的边沿盘算平台。它被行业公认为“呆板人新大脑”。

Jetson AGX Thor(以下简称 Thor)是面向呆板人和物理设备的新一代技能栈。这个全新的“呆板人大脑”基于Blackwell GPU架构,峰值算力达到 2070 FP4 TFLOPS,AI 性能较现有的Jetson AGX Orin模块进步多达7.5倍,同时能效提拔3.5倍。

Thor最大的突破在于,它可以让已往依靠云端处理惩罚或多块芯片的呆板人,在单一紧凑的模块上实现及时感知和决策。

现在,亚马逊仓储呆板人和波士顿动力等早期用户,已经开始在自家产品 上集成Thor,目标是打造出更智能、更独立的呆板人产品 。

地球的另一边,字节7月和9月先后推出自研的通用呆板人模子GR-3和Robix,展示了在真实家庭场景下实行复杂使命的能力。

字节Seed团队7月尾放出一条演示视频,一台呆板人搭载了字节最新的呆板人VLA效果GR-3。在演示视频中,它完成了将衣架插入衬衫并将其挂起来的使命。

上周,Seed又掏出了最新的呆板人研究效果——Robix。它和GR-3一路 ,构成了字节新一代呆板人模子矩阵。

此时隔断黄仁勋在 GTC 2025 的感叹 仅已往半年韶光 。两家巨子 在呆板人赛道的“同频”,也给人这样 一种印象:黄仁勋和张一鸣,这次想到一块去了。

A

在Thor横空降生 前,英伟达已经成为呆板人赛道的领头羊。

英伟达Jetson平台在高端呆板人和自主 呆板开辟范畴占领 主导职位,其生态系统中拥有凌驾200万名开辟人员,凌驾7000家公司使用上一代产品 Orin系列。

本年8月,英伟达宣布Thor 正式开售。单从硬件性能和成熟度来看,它在同类产品 中几乎 处于绝对领先的职位。

现在,英特尔、高通等竞争敌手 的边沿AI(Edge AI,在设备端本地运行人工智能)产品 相对落伍,尚无法在单一模块中实现划一水平的集成盘算。

更关键的是,英伟达将硬件与软件堆栈精密绑定,并依托CUDA对象 包的广泛运用 ,形成了生态护城河。

Thor可以直接挪用 英伟达完备的Isaac呆板人软件平台、AI模子库和仿真对象 ,实现端到端的深度集成。此中包罗英伟达针对呆板人场景的最新模子——Isaac GR00T N1,一款开源、预训练且可定制的基础模子。

GR00T N1采取了受人类认知开导的双系统架构。一个系统是“快速思考行动模子”,其行为类似于人类的反应 和直觉;另一个系统是“慢思考模子”,可以或许推理四周情况和收到的指令,从而计划 行动。

GTC 2025上, 1X公司CEO Bernt Børnich体现:“在我们开辟自主 模子的同时,英伟达的GR00T N1明显提拔了呆板人的推理能力和技能。我们仅使用少少的后训练数据,就将NEO Gamma完全部署到位。”

然而,Thor并非完美无缺。

首先是代价。Jetson AGX Thor开辟套件的售价为3499 美元,很难成为普通家用产品 的选择。

其余 ,Thor平台有着更高的功率要求,这意味着其适配的产品 必要稳固的供电能力,例如自动驾驶汽车、工场 呆板人、送货呆板人等。

B

在“呆板人大脑”的赛道上,英伟达很快有了中国竞争敌手 。

7月尾,字节宣布 全新一代呆板人VLA模子GR-3。官方演示中,搭载着GR-3的呆板人ByteMini将衣架插入衬衫并将其挂起来,还完成了拾取家居用品、放置在指定位置等高难度“副本”。

其余 ,ByteMini可以区分差别尺寸的物品,并成功实行拿起“较大的盘子”的指令。

拆解演示进程 和技能陈诉可以发明 ,GR-3可以或许理解复杂、抽象的语言,比如“较大的盘子”“左边的椅子”等。

其余 ,GR-3少样本适配能力较强。据外媒报道,Seed采取混合办法 训练:首先向 GR-3 输入大批 图像和文本数据,随后借助虚拟现真相况中的人机交互进行微调;最后再让其学习并模拟实际天下中的呆板人动作。这套训练策略,使 GR-3 具备了在复杂且难以预测的情况中保持顺应性的能力。

据相识,GR-3比拟 GR00T系列有着更大的参数范围 ,实际运用 中体现更好。

曾在Meta就职的AI科学家Chris Paxton在一篇关于呆板人范畴VLA的研究中披露,字节的40亿参数GR-3模子,体现好像优于英伟达GR00T,后者参数量大约 20 亿。可以公道推测,一旦有足够的数据和算力支撑,“范围 定律”(scaling laws)依然有效。

GR-3让字节在“呆板人大脑”赛道有了一席之地,不过 ,VLA模子更多是用在实行层面,比拟 起“大脑”的定义 ,GR-3 更像是呆板人肢体的“神经元”。

字节Seed团队的最新效果,补齐了“呆板人大脑”的另一块拼图。

上周,Seed团队宣布 最新效果 Robix,在呆板人系统中负任务 务计划 、推理、自然语言交互等使命。

Seed研究员董恒在小我 主页上这样 描述Robix:“这是一个集推理、计划 和自然交互于一体的同一呆板人大脑,其性能优于GPT-4o和Gemini 2.5 Pro。”

不过 ,Robix并不是“呆板人大脑”完全体。

按照 Robix 的技能文档,流程中“身段动作/实行”部分平日 由低层掌握 器模子来完成,也就是对应的VLA模子,如GR-3或类似掌握 器。换言之,GR-3 和 Robix 必要在驱动呆板人的场景中相互配合 。

Robix的这套工作逻辑,和英伟达GR00T N1的双系统模式有共通之处,一个系统负责推理,另一个系统负责实行。

在官方测试中,搭载GR-3作为掌握 器的Robix,通过 ByteMini 呆板人完成了餐桌清算、收银装袋和饮料筛选的使命;与其他模子横向对比,仅在饮料筛选项目上略微落伍于 Gemini 2.5 Pro,其他项目均得分最高。

C

Robix和GR-3不是字节第一次在呆板人VLM范畴“秀肌肉”。很多人把字节看作互联网内容公司,但在呆板人范畴,它实在是一位低调的“隐形巨子 ”。

2023年12月,Seed团队推出GR-1,该模子也是Seed在呆板人VLA范畴的前瞻性实行。作为技能验证产品 ,GR-1采取了先用大范围 视频生成式预训练,再无缝用呆板人数据微调的模式。

基于GR-1的技能积聚,Seed团队2024年推出GR-2。GR-2使用了3800万段视频、超500亿token的数据作为预训练的基础,然后再用呆板人轨迹做动作/视频生成微调。它在超100个操控使命测试中的平均成功率高达97.7%。

GR-3 和 Robix,是字节在大模子期间研究范畴延伸的最新一环。

《晚点LatePost》在 2023 年的报道中披露,字节的呆板人摸索 始于 2020 年。其时张一鸣就对呆板人体现出爱好,此后会不定期参与呆板人项目讨论。

两年韶光 已往,字节已经静静量产了1000 台以上的呆板人。这些轮式物流呆板人主要用于在仓库、产线上运输包裹与零件,聚焦于“仓储+自动搬运”的一体化计划 ,能自主 学习、计划 门路、移动到目标地,办事 于自家的抖音电商仓以及顺丰、比亚迪等外部客户。

不过 ,这些物流呆板人更多是早期的技能积聚。从 Robix、GR-3和ByteMini的技能成长 路径不难看出,字节致力于在具身智能范畴取得领先职位。

近期,字节雇用官网涌现 出一批呆板人干系的岗位 ,此中有岗位 明确提到“下一代通用呆板人”。所有岗位 都属于Seed团队,base在北京和上海。南华早报在7月的报道中披露,Seed团队本年人数预计凌驾300人。

另一方面,字节在呆板人产业中也积极投入。

此前,国内具身智能头部企业宇树科技完成C轮融资,公司估值超百亿。该轮融资的金主名单中,除了阿里、腾讯系的名字,也涌现 了与字节渊源颇深的锦秋基金。

锦秋基金由原字节财政投资负责人杨洁2022年建立,团队焦点成员多来自字节的投资系统 。其名称“锦秋”源自张一鸣和字节的创业时的发源地——位于北京海淀区的锦秋家园。

D

字节正在公司内外加速布局呆板人范畴。不过 ,现在字节的技能积聚主如果 模子侧的“呆板人大脑”层面;而英伟达的最新芯片计划 ,好像和字节形成上风互补。

多年以来,字节是英伟达在中国最紧张的客户之一,而黄仁勋也深知中国企业在具身智能市场的紧张职位。

本年7月,他现身北京链博会揭幕 式,并在谈话 中体现:“AI的下一海浪 潮将是呆板人,未来的呆板人不仅可以或许推理和实行,还能真正理解物理天下。”

对黄仁勋而言,中国市场在这条路径上具有不成 替代的意义。

英伟达官方博客体现,多家国内公司已经使用Thor,包罗联影医疗、万集科技、优必选、银河通用、宇树科技、众擎呆板人和智元呆板人等。不过 ,在这一长串名字中,尚未见到字节的身影。

英伟达博客还引述了宇树科技CEO王兴兴的谈话 :“Jetson Thor带来了盘算能力的巨大 飞跃,赋能呆板人更强的灵敏性、更快的决策制定以及更高的自主 水平,这对于呆板人在实际天下中实现导航与交互至关紧张。”

2025年1月,在CES全球斲丧电子展上,黄仁勋与14家合作的人形呆板人公司一同登台,此中6家来自中国,包罗宇树科技和小鹏等企业。

另一方面,字节 Seed 团队并非只聚焦呆板人模子范畴。

在测试 GR-3 和 Robix 的进程 中,字节同步推出了ByteMini。尽管看起来更像是测试用途 的实行性产品 ,但浏览 Seed 团队的技能陈诉可以发明 ,这款呆板人的技能规格并不低,包含 22 个自由度,手段 采取球形腕计划,在狭窄空间/高机灵使掷中有较高的操纵能力。

可以说,ByteMini的涌现 ,已经体现出字节打造下一代具身智能产品 的野心。而跟着 英伟达拿出了新一代呆板人芯片计划 ,想到一块去的黄仁勋和张一鸣,好像有望在呆板人范畴,延续这两家头部企业的合作关系。

0

路过

0

雷人

0

握手

0

鲜花

0

鸡蛋

推广
火星云矿 | 预约S19Pro,享500抵1000!
本文暂无评论,快来抢沙发!

有招是一个优质的生活妙招创作平台,在这里,你可以任意分享你的妙招经验,日常生活、技能学习、成长励志、恋爱婚姻……我们相信,每个人都有独特的生活妙招,有着无穷的创造力。
  • 官方手机版

  • 微信公众号

  • 商务合作