盘古大模型与通义千问，谁抄袭了谁

首页 ›今日热点 ›科技财经

收藏分享邀请

摘要

作者 | 小信鸽来源 | 数聚势能导语：华为盘古3.5与阿里通义千问1.5-7B模型之间的“指纹”相干性，得分高达0.927。一份GitHub陈诉带来的"盘古抄袭门"统统始于7月4日公布在代码托管平台GitHub上的技术剖析陈

作者 | 小信鸽

来源 | 数聚势能

导语：华为盘古3.5与阿里通义千问1.5-7B模型之间的“指纹”相干性，得分高达0.927。

一份GitHub陈诉带来的"盘古抄袭门"

统统始于7月4日公布在代码托管平台GitHub上的技术剖析陈诉。

一位名不见经传的弟子（一位自称为哥斯达黎加大学的韩国弟子），用一种名为“模型指纹”（LLM-Fingerprint）的技术，直指中国两大AI模型巨子 ——华为与阿里。

陈诉直指华为盘古大模型 v3.5在多个关键特征上与阿里开源的通义千问v1.5高度相似，由此开端一场关于“复用”与“抄袭 ”的论战。

代码大概不会说谎，但代码的相似性该如何解读？

这不但是一场技术论战，更是一次对整个AI行业伦理和规则的拷问。

本文无意充任法官，裁定“抄袭 ”与否。我们将深入剖析这场争议背后的技术细节、开源文化辩论与贸易竞争逻辑，探究它为狂飙突进的大模型时代，展现了哪些深层次的挑战与时机。

“指纹技术”指控：无法忽视的0.927

这场风暴的焦点，是一项名为“LLM-Fingerprint”的技术。

简单来说，它就像提取人类指纹一样，经由进程剖析模型在处理惩罚特定“触发词”（trigger words）时的响应模式——即所谓的“自留意力”分数，来为每个大模型天生一个奇特的身份标识。

所谓的铁证

由HonestAGI团队公布的陈诉表现，华为盘古3.5与阿里通义千问1.5-7B模型之间的“指纹”相干性得分高达0.927。

这个数字意味着什么？陈诉同时对比了其他多个主流模型，它们之间的相干性得分广泛低于0.1。

云云接近1的得分，在统计学上暗示着两个模型大概存在极强的同源性，甚至大概是基于同一底座模型进行微调的“派生”关系。

华为反驳

面对指控，华为灵敏回应，但其反驳逻辑被外界以为“不甚科学”。

华为方面指出，用同为通义千问系的不同版本模型进行指纹对比，同样能得出高相干性，试图以此稀释其与盘古模型高相干性的指控效率。别的，华为夸张盘古与通义在词表（tokenizer）和部分派置文件上存在不同。

然而，在技术专家看来，仅转变词表或配置文件，并不足以洗脱底层模型结构和参数相似的嫌疑。这场技术攻防，让争议变得更加空中楼阁。

开源罗生门：“复用”与“抄袭 ”一线之隔

这场争议之以是能激发云云大的波澜，是因为它触及了AI开源生态的焦点精力与现实逆境。

站在伟人的肩膀上

大模型研发本钱极高，据华为大模型负责人田奇此前泄漏，一次有效训练的本钱高达1200万美元。

因此，“站在伟人的肩膀上”——即基于精良的开源模型进行复用、微调和二次开辟，是行业加速创新的基石，也是广泛范式。正如Hugging Face榜单所表现的，排名前十的开源模型中，一度全部是基于阿里通义千问的二次开辟衍生而来。

阿里的Qwen系列自开源以来，凭借其全尺寸、全功效的特点，尤其在to B市场已创建起显著优势 ，笔者获悉，众多企业早期均采用通义模型进行探索。

一线之隔的含糊地带

那么，“复用”与“抄袭 ”的边界毕竟在那里？是参数的相似度，还是是否依照开源协定？

华为在声明中认可了其盘古v3.5在“实现中鉴戒了业界精良的结果”，并引用了Qwen的技术陈诉。但问题在于，通义千问利用的是Apache 2.0开源协定 ，该协定允许贸易利用和修改，但请求在修悛改的文件中保存原始的版权、专利、商标和归属声明。

在模型参数这种新型“代码”面前，如何“声明”和“归属”，现有协定好像存在表白的含糊地带和监管的无力感。这背后是司法、道德与社区共识的繁芜博弈。

巨子暗战：不容有失的技术叙事

将视线拉高，这场技术争议的背后，是国产AI巨子间心照不宣的竞合博弈。

盘古大模型，对华为而言远不止一款AI产物。

它是华为构建“软硬芯云”全栈自立生态的关键一环，是其欲在AI时代掌握话语权的焦点筹码，尤其是在国产算力（昇腾）上的标杆应用。

正如华为将其植入HarmonyOS 4，盘古承载的是华为技术自研、安全可控的计谋叙事。也正因云云，“抄袭 ”的指控直接袭击了华为最焦点的资产——技术自研的荣誉。

这不但关乎贸易信用，更关乎市场对其全栈AI本领的信托。在百度、阿里、腾讯等巨子林立，智谱、月之暗面等新秀辈出的“百模大战”中，任何荣誉上的瑕疵都大概影响其市场格式。

此事故无疑是阿里与华为在中国AI市场猛烈竞争的缩影。

据笔者相识，现在中国80%的科技企业和一半的大模型公司都跑在阿里云上，通义系列模型已服务超9万家企业。一边是凭借云基础办法和开源生态强势结构的阿里，另一边是手握硬件和全栈解决计划试图青出于蓝的华为。

这不但是两个模型的对决，更是两条技术门路、两个贸易生态的扳手腕。

沉默的阿里：“受害者”通义暂未发声

事件中一个颇为吊诡的征象是：作为风暴中心的另一方，阿里通义千问团队至今保持着官方沉默。

阿里的沉默，背后大概有多种考量。

通义大模型家族是阿里自研的一系列大模型，具备多尺寸、全模态、机能优的特点，重要涵盖通义千问系列、通义万相系列、舞动人像、HumanAIGC、语音合成、文本向量、多模态向量等模型。

模型数量方面，截至2025年3月5日，据阿里云百炼大模型平台，通义模型家族已推出至少 228 个模型。

尺寸方面，通义大模型家族供给多种参数尺寸的模型供用户选择，适用多种场景，如开源模型 Qwen2.5的参数规模可分为0.5B/1.5B/3B/7B/14B/32B/72B，可对应端侧模型 /小模型 /大模型三种场景。模态方面，通义大模型家族覆盖文本、图像、语音、视频等全模态。

有匿名流士向笔者泄漏，阿里内部并非不关注，而是大概采取了“静观其变，让技术证据说话”的计谋，不肯将贸易竞争升级为公开的舆论骂战。

另一种大概，则是对行业内“鉴戒”与“复用”的潜规则抱有某种水平的默认，毕竟在开源社区，代码与头脑的鉴戒本是常态，只要不超出司法红线，太过声讨大概会破坏整个开源生态的气氛。

无论如何，阿里的态度将是影响事故终极走向的关键变量。

它的发声或连续沉默，都将成为定义此次争议性子的注脚。是将其定性为恶性抄袭，还是行业发展初期难以避免的含糊实践，大概就在阿里的一念之间。

一次深刻的AI开源生态“压力测试”

回归焦点，盘古与通义的争议是一次深刻的“压力测试”，它暴虐地暴露了当前AI开源生态的软弱性与治理的滞后性。技术跑得太快，规则和信托体系没有跟上。

无论最终结论如何，这场风浪都应成为中国AI财产走向成熟的催化剂，未来，我们以为行业迫切需要关注一下3点：

创建更清晰的规则： 行业需要共同探索，创建更明白的AI模型 “引用”和“派生”尺度。正如学术界的论文查重体系，大概未来会出现行业公认的模型溯源和相似度检测平台，为原创性供给技术裁定依据。
创建更透明的机制： 鼎力大举推广模型的“出身证”（Model Cards）和训练数据透明化，闪开源不但是开放结果，更要开放进程。这不但是对原创者的保护，也是对利用者负责。
创建性的反思： 中国的AI玩家们，需要从“疾走 ”的比赛模式，适度转向“深耕”的马拉松模式。与其在参数和榜单上内卷，不如将更多精力投入到真正的原始创新与健康的生态创建中。

这场风浪，不应仅仅是一场口水战，它更应成为一次全行业的团体反思，鞭策中国AI真正走向高质量、可连续的创新之路。

#阿里 #华为 #通义千问 #盘古大模型 #AI

路过

雷人

握手

鲜花

鸡蛋

愚老大

关注Ta

推广

火星云矿 | 预约S19Pro，享500抵1000！

上一篇：年入46亿！北京国度队又干出超级独角兽：半导体制造设备环球第二

下一篇：超20％收益基金曝光：富国25只霸榜，这一赛道竟成最大赢家

本文暂无评论，快来抢沙发!

您还未登录：
登录账号
立即注册

愚老大 关注Ta

0 粉丝10 主题

该作者很懒，什么也没有填写

盘古大模型与通义千问，谁抄袭了谁

一份GitHub陈诉带来的"盘古抄袭门"