【文/不雅 察者网 张菁娟】据香港英文媒体《南华早报》10日报道,中国团队不日 乐成研发并公布 了类脑脉冲年夜 模子,这是一款旨在降低能耗、提升性能且无需依靠英伟达芯片的人工智能体系。 该模子名为“瞬悉1.0”
【文/不雅 察者网 张菁娟】据香港英文媒体《南华早报》10日报道,中国团队不日 乐成研发并公布 了类脑脉冲年夜 模子,这是一款旨在降低能耗、提升性能且无需依靠英伟达芯片的人工智能体系。 该模子名为“瞬悉1.0”(SpikingBrain-1.0),是中国科学院主动化研究 所李国齐、徐波团队与沐曦MetaX互助打造的,其核心在于模拟人类年夜 脑仅激活所需神经元的运作模式。 报道称,与ChatGPT等主流人工智能工具差别,“瞬悉1.0”会有选择性地对输入信息做出相应,进而实现节能并加快相应速度 。 中国科学院主动化研究 所称,“瞬悉1.0”在多个核心性能上实现冲破 ,得益于这种计划,该模子能依托高效转换训练范式,以约为主流年夜 模子2%的预训练数据量实现与浩繁开源Transformer模子在多任务说话 明确(MMLU),中文多任务说话 明确(CMMLU、Ceval),常识推理能力(ARC、HS)任务上相媲美的性能。在某些情况下,其运行速度 比传统模子快出100倍。 这是中国首次提出年夜 规模类脑脉冲底子模子架构、并首次在国产图形处理惩罚器(GPU)算力集群上构建类脑脉冲年夜 模子的训练和推理框架。提出的模子解决了脉冲驱动限定下的年夜 规模类脑模子性能退化题目 ,其超长序列处理惩罚能力在法律/医学文档分析、繁芜 多智能体模拟、高能粒子物理实验、DNA序列分析、分子动力学轨迹等超长序列任务建模场景中具有显着的潜在效率优势。 中国科学院主动化研究 所夸大,此次 公布 的年夜 模子为新一代人工智能发展提供了非Transformer架构的新技术路线,并将启迪更低功耗的下一代神经形态计算理论和芯片计划。 报道指出,在美国收紧对前辈 人工智能芯片出口牵制 的配景下,这一模子具有紧张的计谋 意义。 现在,该研究 团队开源了SpikingBrain-1.0-7B模子并开放SpikingBrain-1.0-76B测试网址。 该体系在试用网站上介绍道,其深度融会 人脑信息处理惩罚机制与脉冲计算范式,致力于经过历程 高效、节能、国产化的类脑推理为利用者提供强盛而可靠的智能服务。
![]() 网站截图 据报道,当前最受欢迎的人工智能模子均需巨年夜 计算能力支持。企业为训练这些模子,需依靠配备高端芯片的年夜 型数据中央,而这类芯片会消耗年夜 批 电力与冷却水。 即便完成训练,这些体系对资源 的需求依然很高。处理惩罚长输入或生成 繁芜 相应时,它们会因并行处理惩罚每个词汇而非聚焦症结 信息而变慢,同时给内存带来压力,这不仅推高运行成本,也加剧了对情况的影响。 比拟 之下,“瞬悉1.0”的研发团队从真实神经元的工作原理中罗致灵感。该体系不会同时处理惩罚所有信息,而是有选择性地做出反响 ,以更低能耗完成繁芜 任务,与人类年夜 脑的工作方法 高度相似。 其核心技术模拟了年夜 脑仅在受到触发时才快速发送旌旗灯号 脉冲的特征 。这种由事件驱动的方法 使体系年夜 部分时光 处于“静默”状态,有助于坚持 高效节能。 研究 人员称,只管SpikingBrain所用数据仅为传统模子的一小部分,但其性能却与主流开源替换模子相称,并且它在处理惩罚长序列数据方面也表现出色。 他们在论文中写道:“这一冲破 性实践不仅为国产算力平台上的高效年夜 模子研发提供了宝贵经验 ,更对将来年夜 模子的规模化部署与应用 开发了新路径。” 本文系不雅 察者网独家稿件,未经授权,不得转载。 |
2025-05-03
2025-03-05
2025-02-26
2025-03-05
2025-02-26