华为盘古否定抄袭阿里后，其年夜模型员工自曝存在套壳、续训、洗水印

首页 ›今日热点 ›科技财经

收藏分享邀请

摘要

2025年6月30日，华为高调宣布开源其盘古年夜模型核心组件(Pangu Pro MoE)，包含 70亿参数稠密模型和720亿参数的肴杂专家模型，传播鼓吹这是构建昇腾生态的症结办法。然而仅隔四天，一项发布于GitHub的研讨激发业界存

2025年6月30日，华为高调宣布开源其盘古年夜模型核心组件(Pangu Pro MoE)，包含 70亿参数稠密模型和720亿参数的肴杂专家模型，传播鼓吹这是构建昇腾生态的症结办法。

然而仅隔四天，一项发布于GitHub的研讨激发业界存眷：用户@HonestAGI通过“LLM指纹”技能剖析指出，盘古Pro MoE与阿里通义千问Qwen-2.5 14B模型的留意力参数分布雷同性高达0.927(1.0为完备一致)，远超业内0.7以下的正常差别规模。

华为诺亚方舟实验室声明截图

华为诺亚方舟实验室7月5日发布最新声明，表现盘古 Pro MoE 开源模型是基于昇腾硬件平台开辟、训练的底子年夜模型，并非基于其他厂商模型增量训练而来。

然而，就在7月6日凌晨，一位自称是盘古年夜模型团队的员工自爆，确实存在套壳、续训、洗水印的征象。

爆料文章截图

该员工表现，因为团队初期算力非常有限，虽做出了很多积极和挣扎，但没有预期效果，内部的质疑声和向导的压力也越来越年夜。后来小模型实验室多次套壳竞品，向导层被指默许造假举动调换短期结果。

自爆文中称：“经过内部的剖析，他们现实上是利用Qwen 1.5 110B续训而来，通过加层，扩增ffn维度，添加盘古pi论文的一些机制得来，凑够了也许 135B的参数。”并表现，“听同事说他们为了洗失落千问的水印，采取了不少办法，以致包含故意训了脏数据。”“他们选择了套壳Deepseekv3续训。他们通过冻住Deepseek加载的参数，举行训练。”

最后他表现出于对技能伦理的对峙，决定去职并曝光内幕。

停止现在，华为并未对此自爆内容发表声明。

来源：新浪科技、亚方舟实验室、云头条

路过

雷人

握手

鲜花

鸡蛋

友谊之花

关注Ta

推广

火星云矿 | 预约S19Pro，享500抵1000！

上一篇：横店东磁的印尼电池片买卖，为何如此火爆？

下一篇：美国稀有妥协，EDA软件解禁！但下一场硬仗仍旧艰苦

本文暂无评论，快来抢沙发!

您还未登录：
登录账号
立即注册

友谊之花 关注Ta

0 粉丝16 主题

该作者很懒，什么也没有填写

华为盘古否定抄袭阿里后，其年夜模型员工自曝存在套壳、续训、洗水印

火星云矿 | 预约S19Pro，享500抵1000！

荣昌当局食堂主厨都炒麻了：连炒十三四个小时，均匀一人炒18

2025年3月4日晚上，共有3名老虎落马，大快人心，这是人民的

《难哄》vs《偷偷藏不住》，5个角色不同演员对比，伤害太大

胆大包天！女子冒充亲友混进喜宴，偷窃礼金被抓包，遭群殴后

杨颖最新大片下巴有凹坑，体型过瘦状态疲惫，强凹少女感好尴

华为盘古否定 抄袭阿里后，其年夜 模型员工自曝存在套壳、续训、洗水印

火星云矿 | 预约S19Pro，享500抵1000！

荣昌当局食堂主厨都炒麻了：连炒十三四个小时，均匀 一人炒18

2025年3月4日晚上，共有3名老虎落马，大快人心 ，这是人民的

《难哄》vs《偷偷藏不住》，5个角色不同演员对比，伤害太大

胆大包天！女子冒充亲友混进喜宴，偷窃礼金被抓包，遭群殴后

杨颖最新大片下巴有凹坑，体型过瘦状态疲惫，强凹少女感好尴

华为盘古否定抄袭阿里后，其年夜模型员工自曝存在套壳、续训、洗水印

荣昌当局食堂主厨都炒麻了：连炒十三四个小时，均匀一人炒18

2025年3月4日晚上，共有3名老虎落马，大快人心，这是人民的