首页 ›今日热点 ›科技财经

中国始创芯片登Nature：比英伟达A10快500倍！自研光电混合技能

收藏分享邀请

摘要

金磊发自上海量子位 | 公众号 QbitAI来自国内的光电混合芯片技能，登上最新顶刊Nature！这次的效果主要聚焦在了自主研发的光子盘算处理惩罚器——PACE（Photonic Arithmetic Computing Engine）。简单来说，PACE是

金磊发自上海
量子位 | 公众号 QbitAI

来自国内的光电混合芯片技能，登上最新顶刊Nature！

这次的效果主要聚焦在了自主研发的光子盘算处理惩罚器——PACE（Photonic Arithmetic Computing Engine）。

简单来说，PACE是一种基于光电混合的架构，它经由过程光实行矩阵向量乘法，可以实现超低延迟和高能效的盘算。

依照论文中公开的数据表现，PACE在办理组合优化题目（如伊辛题目和最年夜割/最小割题目）时，盘算延迟低至3纳秒，比传统GPU快了两个数量级。

这一突破的核心在于PACE的高度集成计划。

这个别系集成了超过16000个光子组件，并经由过程立异的2.5D混合先辈封装技能，将光子集成电路（PIC）与电子集成电路（EIC）无缝集成。

这种计划不仅办理了年夜范围光电系统集成中的技能艰苦，更为贸易化落地奠定了基础。

而这个芯片技能，恰是来自国内始创企业曦智科技。

据了解，这是继八年前曦智科技开创人沈亦晨博士在Nature发表封面论文后，再一次登上这一顶刊。

那么PACE云云的速率，到底是怎样做到的呢？

初次公开：16000个光子组件的高度集成

跟着人工智能的快速成长，盘算需求呈发作式增加，传统电子盘算面临着功耗、速率等方面的瓶颈。

光子盘算凭借光的奇特性质，犹如时举行乘法和累加过程、数据传输能耗低、制止电阻斲丧和发烧题目等，成为极具潜力的替换计划，受到环球广泛存眷。

然而，光子盘算在成长过程中面临诸多挑战。一方面，集成光子学制造相对不成熟，缺少先辈的封装办理计划，导致年夜范围集成光子系统在机能提升、标准计划与验证以及封装等方面艰苦重重。

另一方面，光子盘算在光学存储、盘算精度（尤其在年夜范围复杂电路中）以及适配模型和算法等方面存在不敷，限制了其贸易化历程。

为此，曦智科技提出的PACE采取混合架构（初次对外公开），将光子集成电路（PIC）和电子集成电路（EIC）集成在一个别系级封装（SiP）中。

△PACE系统摆设

PIC 负责实行光矩阵向量乘法（oMAC）操作，EIC则处理惩罚控制、迭代逻辑、数据输入输出、存储以实时钟控制等功能。

这种架构计划充实发挥了光子盘算在速率和低延迟方面的上风，以及电子盘算在逻辑处理惩罚和存储方面的优点。

在PIC中，团队计划了1×64光学数据模块和64×64权重模块实行oMAC操作。

光信号经由过程高机能光栅耦合器从外部激光阵列耦合进入电路，经过向量调制器阵列和权重调制器模块举行调制，最后在光电探测器阵列举行信号转换和归并。

EIC基于28-nm贸易CMOS技能计划，PIC则是基于65-nm硅光子技能构建，单个芯片集成了超过16000个光子组件，实现了高度集成。

这种混合架构充实发挥了光盘算的并行上风：光信号在波导中传输时天然完成乘加运算（oMAC），而电子电路则处理惩罚逻辑控制与数据存储。

实验数据表现，64×64矩阵运算延迟仅3纳秒，比传统GPU快500倍。

除此之外，研讨团队创造性地将光学矩阵运算运用于组合优化题目。

经由过程计划”噪声驱动递归算法”，PACE系统能够高效求解伊辛模型：

在求解63节点Max-cut题目时，系统经过均匀537次迭代（耗时2.7μs）即可达到92.7%的收敛率，相比NVIDIA A10 GPU提速295倍。

更惹人凝视的是”图像搜刮”演示，系统能从随机初始状态收敛到预设的”猫”图像目标。

Nature审稿人对曦智科技团队在光子盘算工程化方面作出的积极给予了高度必定：

在光子盘算领域，平日会经由过程小范围的演示对年夜范围系统机能举行乐不雅揣摸，但本文中的数据均来自整个PACE盘算系统的实测机能，作者们工程化地实现了一个超年夜范围光子矩阵盘算系统，可谓“豪举 ”。

还环球首发了新一代光电盘算卡

就在前不久的3月25日，曦智科技还正式推出全新一代光电混合盘算卡 ——曦智天枢。

曦智天枢深度融合了光芯片与电芯片的上风，采取先辈的3D封装技能，是一款高度可编程的光电混合盘算卡。

与前代产品相比，其在光电集成度、光子矩阵范围、盘算精度及可编程性等方面均实现了显着提升。

它不仅支撑科学盘算（如伊辛算法），还增强了对ResNet50等贸易算法的适配性，进一步拓宽了运用场景。

曦智天枢采取非相干架构计划，具备出色的抗干扰本领和高盘算精度。

其核心处理惩罚器由光学处理惩罚单位（OPU）和电学专用集成电路（ASIC）构成，经由过程 3D先辈封装技能实现协同工作，主频速率达1GHz，输出精度为8bit。

光芯单方面积提升至600平方毫米，器件数量超过四万个，集成度年夜幅提高。

别的，其最年夜支撑 128x128矩阵范围，运算本领和灵活性均得到显着增强。用户可经由过程 API自由配置盘算矩阵系数，实现更高效的优化与适配。

在软件方面，产品搭载了曦智光电混合盘算软件栈，支撑主流框架如PyTorch和ONNX，用户可经由过程曦智编译器灵活构建高效的运用模型。

不仅云云，平台还支撑用户自定义算子，进一步扩大了算法开发的灵活性。

对此，沈亦晨博士表现：

曦智天枢初次实现了光电混合盘算在复杂贸易化模型中的运用，是曦智科技光电混合算力技能在产品化和贸易化历程中的紧张突破。
我们坚信，光电混合将会为人工智能、年夜说话模型、智能制造等领域带来算力革新。
光+电，会是未来的答案。

参考链接：https://www.nature.com/articles/s41586-025-08786-6

路过

雷人

握手

鲜花

鸡蛋

眼泪无邪

关注Ta

推广

火星云矿 | 预约S19Pro，享500抵1000！

上一篇：近20支部队备赛全球首个呆板人“半马” ，亮点在哪

下一篇：黄金涨势“火力全开”，背后的逻辑是什么？

本文暂无评论，快来抢沙发!

您还未登录：
登录账号
立即注册

眼泪无邪 关注Ta

0 粉丝13 主题

该作者很懒，什么也没有填写

荣昌当局食堂主厨都炒麻了：连炒十三四个小时，均匀一人炒18

2025-05-03

2025年3月4日晚上，共有3名老虎落马，大快人心，这是人民的

2025-03-05

《难哄》vs《偷偷藏不住》，5个角色不同演员对比，伤害太大

2025-02-26

胆大包天！女子冒充亲友混进喜宴，偷窃礼金被抓包，遭群殴后