作者 | 小信鸽来源 | 数聚势能导语:华为盘古3.5与阿里通义千问1.5-7B模型 之间的“指纹”相干性,得分高达0.927。一份GitHub陈诉带来的"盘古抄袭 门"统统始于7月4日公布 在代码托管平台GitHub上的技术剖析 陈
作者 | 小信鸽 ![]() 一份GitHub陈诉带来的"盘古抄袭 门"统统始于7月4日公布 在代码托管平台GitHub上的技术剖析 陈诉。 一位名不见经传的弟子(一位自称为哥斯达黎加大学的韩国弟子),用一种名为“模型 指纹”(LLM-Fingerprint)的技术,直指中国两大AI模型 巨子 ——华为与阿里。 陈诉直指华为盘古大模型 v3.5在多个关键特征上与阿里开源的通义千问v1.5高度相似,由此开端 一场关于“复用”与“抄袭 ”的论战。 代码大概不会说谎,但代码的相似性该如何解读? 这不但是一场技术论战,更是一次对整个AI行业伦理和规则的拷问。 本文无意充任 法官,裁定“抄袭 ”与否。我们将深入剖析 这场争议背后的技术细节、开源文化辩论与贸易竞争逻辑,探究它为狂飙突进的大模型 时代,展现了哪些深层次 的挑战与时机。 ![]() “指纹技术”指控:无法忽视 的0.927这场风暴的焦点,是一项名为“LLM-Fingerprint”的技术。 简单来说,它就像提取人类指纹一样,经由进程 剖析 模型 在处理惩罚特定“触发词”(trigger words)时的响应模式——即所谓的“自留意力”分数,来为每个大模型 天生一个奇特 的身份标识。 所谓的铁证由HonestAGI团队公布 的陈诉表现,华为盘古3.5与阿里通义千问1.5-7B模型 之间的“指纹”相干性得分高达0.927。 这个数字意味着什么?陈诉同时对比了其他多个主流模型 ,它们之间的相干性得分广泛低于0.1。 云云接近1的得分,在统计学上暗示着两个模型 大概 存在极强的同源性,甚至大概 是基于同一底座模型 进行微调的“派生”关系。 华为反驳面对指控,华为灵敏回应,但其反驳 逻辑被外界以为“不甚科学”。 华为方面指出,用同为通义千问系的不同版本模型 进行指纹对比,同样能得出高相干性,试图以此稀释其与盘古模型 高相干性的指控效率 。别的,华为夸张 盘古与通义在词表(tokenizer)和部分派 置文件上存在不同。 然而,在技术专家看来,仅转变 词表或配置文件,并不足以洗脱底层模型 结构和参数相似的嫌疑。这场技术攻防,让争议变得更加空中楼阁。 ![]() 开源罗生门:“复用”与“抄袭 ”一线之隔这场争议之以是能激发 云云大的波澜 ,是因为它触及了AI开源生态的焦点精力与现实逆境。 站在伟人 的肩膀上大模型 研发本钱极高,据华为大模型 负责人田奇此前泄漏 ,一次有效训练的本钱高达1200万美元。 ![]() 因此,“站在伟人 的肩膀上”——即基于精良的开源模型 进行复用、微调和二次开辟,是行业加速创新的基石,也是广泛范式。正如Hugging Face榜单所表现的,排名前十的开源模型 中,一度全部是基于阿里通义千问的二次开辟衍生而来。 阿里的Qwen系列自开源以来,凭借其全尺寸、全功效 的特点,尤其在to B市场已创建起显著优势 ,笔者获悉,众多企业早期均采用通义模型 进行探索。 一线之隔的含糊地带那么,“复用”与“抄袭 ”的边界毕竟在那里?是参数的相似度,还是是否依照开源协定 ? 华为在声明中认可了其盘古v3.5在“实现中鉴戒了业界精良的结果”,并引用了Qwen的技术陈诉。但问题在于,通义千问利用的是Apache 2.0开源协定 ,该协定 允许贸易利用和修改 ,但请求 在修悛改 的文件中保存原始的版权、专利、商标和归属声明。 在模型 参数这种新型“代码”面前,如何“声明”和“归属”,现有协定 好像存在表白 的含糊地带和监管的无力感。这背后是司法 、道德与社区共识 的繁芜 博弈。 ![]() 巨子 暗战:不容有失的技术叙事将视线拉高,这场技术争议的背后,是国产AI巨子 间心照不宣的竞合博弈。 盘古大模型 ,对华为而言远不止一款AI产物。 它是华为构建“软硬芯云”全栈自立 生态的关键一环,是其欲在AI时代掌握话语权的焦点筹码,尤其是在国产算力(昇腾)上的标杆应用。 正如华为将其植入HarmonyOS 4,盘古承载的是华为技术自研、安全可控的计谋 叙事。也正因云云,“抄袭 ”的指控直接袭击 了华为最焦点的资产——技术自研的荣誉。 这不但关乎贸易信用 ,更关乎市场对其全栈AI本领的信托。在百度、阿里、腾讯等巨子 林立,智谱、月之暗面等新秀辈出的“百模大战”中,任何荣誉上的瑕疵都大概 影响其市场格式 。 此事故无疑是阿里与华为在中国AI市场猛烈竞争的缩影。 据笔者相识,现在中国80%的科技企业和一半的大模型 公司都跑在阿里云上,通义系列模型 已服务超9万家企业。一边是凭借云基础办法和开源生态强势结构的阿里,另一边是手握硬件和全栈解决计划 试图青出于蓝的华为。 这不但是两个模型 的对决,更是两条技术门路、两个贸易生态的扳手腕。 ![]() 沉默的阿里:“受害者”通义暂未发声事件中一个颇为吊诡的征象是:作为风暴中心的另一方,阿里通义千问团队至今保持着官方沉默。 阿里的沉默,背后大概 有多种考量。 通义大模型 家族是阿里自研的一系列大模型 ,具备多尺寸、全模态、机能 优的特点,重要涵盖通义千问系列、通义万相系列、舞动人像、HumanAIGC、语音合成、文本向量、多模态向量等模型 。 ![]() 模型 数量方面,截至2025年3月5日,据阿里云百炼大模型 平台,通义模型 家族已推出至少 228 个模型 。 尺寸方面,通义大模型 家族供给 多种参数尺寸的模型 供用户选择,适用多种场景,如开源模型 Qwen2.5的参数规模可分为0.5B/1.5B/3B/7B/14B/32B/72B,可对应端侧模型 /小模型 /大模型 三种场景。模态方面,通义大模型 家族覆盖文本、图像、语音、视频等全模态。 有匿名流士向笔者泄漏 ,阿里内部并非不关注,而是大概 采取了“静观其变,让技术证据说话”的计谋,不肯将贸易竞争升级 为公开的舆论骂战。 另一种大概 ,则是对行业内“鉴戒”与“复用”的潜规则抱有某种水平的默认,毕竟在开源社区,代码与头脑的鉴戒本是常态,只要不超出 司法 红线,太过声讨大概会破坏整个开源生态的气氛 。 无论如何,阿里的态度 将是影响事故终极走向的关键变量。 它的发声或连续沉默,都将成为定义此次争议性子的注脚。是将其定性为恶性抄袭 ,还是行业发展初期难以避免的含糊实践,大概就在阿里的一念之间。 ![]() 一次深刻的AI开源生态“压力测试”回归焦点,盘古与通义的争议是一次深刻的“压力测试”,它暴虐地暴露 了当前AI开源生态的软弱 性与治理的滞后性。技术跑得太快,规则和信托体系 没有跟上。 无论最终结 论如何,这场风浪 都应成为中国AI财产走向成熟的催化剂,未来,我们以为行业迫切需要关注一下3点:
这场风浪 ,不应仅仅是一场口水战,它更应成为一次全行业的团体反思,鞭策 中国AI真正走向高质量、可连续的创新之路。 #阿里 #华为 #通义千问 #盘古大模型 #AI |
2025-05-03
2025-03-05
2025-03-05
2025-02-26
2025-04-06