文 | 年夜 模子之家9月22日晚间,DeepSeek官方突然宣布 更新,宣布DeepSeek-V3.1 现已更新至 DeepSeek-V3.1-Terminus 版本。官方表现,此次更新并非简朴例行迭代,而是针对用户反馈中会合出现 的问题进行了改进,在
9月22日晚间,DeepSeek官方突然宣布 更新,宣布DeepSeek-V3.1 现已更新至 DeepSeek-V3.1-Terminus 版本。官方表现,此次更新并非简朴例行迭代,而是针对用户反馈中会合出现 的问题进行了改进,在对峙 原有能力的同时,进一步提拔了模子的稳定性与划一性。 消息一经发出,不到一个小时便收获了一条“10w+”,足以见得行业对于DeepSeek的关注水平与影响力。 然而,市场的热烈 反响 背后,也夹杂着一丝掉 望:备受等待的新一代推理模子DeepSeek-R2再次缺席。这不仅是一次等待的失 ,更像是一面棱镜,折射出这家明星创业公司,从岁首年月 以R1模子一鸣惊人,到现在焦点产品 迭代的连续延长,在狂飙突进246天后的焦虑、挣扎与抉择。梁文锋和他的DeepSeek,正在上演一出中国年夜 模子领域最富戏剧性张力的“当代启发 录”。 市场预期管理掉 焦:R2宣布 如“镜花水月”当我们把时光 的指针拨回2025 年的早春 ,彼时,DeepSeek-R1的横空降生 ,如同一声惊雷,在中国乃至全球的AI领域炸响。其卓越的数学与代码推理能力,不仅在多项基准测试中对标乃至逾越了OpenAI的顶尖模子,更告急的是,它以一种彻底开源的姿势 ,将推理年夜 模子的门槛拉至史无前例 的低位。DeepSeek是以 一战成神,成为谁人“春节档”最耀眼的国产AI明星,创始人梁文锋也被寄予了寻衅硅谷巨子 的厚望。 DeepSeek-R1推出的那一天,就为梁文锋治下的深度求索,留下了两个难以抹去的烙印:一是“开源且低成本”成为它的标签,二是外界由此对其下一步的等待被抬到了很高的职位 。 然而,辉煌 的序章之后,故事的走向却变得扑朔迷离。行业对下一代推理模子DeepSeek-R2的等待,跟着 时光 的推移,演化 成了一场重复 上演的“狼来了”的故事。据年夜 模子之家统计,停止2025年9月23日,间隔R1宣布 已过去整整246天,而关于R2的宣布 传言,已不下10次。 这场漫长的“挂念剧”始于2月,路透社初次援引信源,称R2“最迟5月初宣布 ”,并暗示其在代码天生和多语言推理年夜 将有重年夜 突破,刹时点燃了市场的热情。随后的几个月,传言变得愈发详细和辘集 。3月,行业内开始传播“3月17日宣布 ”的精准日期;4月,Hugging Face代码库的蛛丝马迹似乎暗示着即将到来的更新;而到了5月,传言达到了巅峰 ,一份详尽的参数信息在网络上走漏,直指R2将采用革命性的“Hybrid MoE 3.0”架构,总参数目高达惊人的1.2万亿。 然而,等待中的5月宣布 会并未准期而至。随之而来的是更多稠浊着掉 望与猜测的消息。有听说称,宣布 延期是由于CEO梁文锋对模子内部测试的性能不甚满足,以为尚未达到对R1的“碾压级”优势 。更症结 的是,来自外部情况的压力开始显现——英伟达 H20芯片的供应问题,成为悬在全部中国AI公司头上的达摩克利斯之剑。 今后的故事线加倍 弯曲 。6月,消息称R2的内部测试效果显示,其性能提拔并未达到颠覆性的水平。7月,万众瞩目标世界人工智能年夜 会(WAIC 2025)上,DeepSeek的缺席让R2宣布 的盼望再度失 。8月,关于“月尾宣布 ”的传言再次甚嚣尘上,但很快被官方辟谣。直到9月初,彭博社的报道才给出了一个新的时光 窗口——计划于第四季度宣布 ,并将主打当下最热门的Agent(智能体)能力。 在长达八个多月的时光 里,DeepSeek官方始终未颁布 R2的明白宣布 计划。这种重复 的传言与失 ,在客不雅 上造成了市场预期的管理掉 焦,也消耗了部门用户的耐烦。更告急的是,在DeepSeek等待R2的这段时光 ,其重要竞争敌手 ,如阿里巴巴的通义千问(Qwen)和百度的文心年夜 模子(ERNIE)等,均已完成了多轮告急的功效 迭代和模子进级 。 在这场无声的角逐中,时光 的流逝,正在成为DeepSeek最极重的成本。 延长的“三重困境”:开源生态的繁华 与焦点产品 的缺位假如仅仅将这八个多月定义为“等待”,那对DeepSeek而言无疑是不公正 的。事实上,在R2缺位的日子里,DeepSeek非但没有停止 ,反而在另一个维度上显现出了惊人的能量和战略远见。梁文锋选择了一条更为艰巨但年夜 概也更为久远的蹊径——构建一个从底层模子到上层工具链完全开源的全栈技术系统 。 这是一场围绕“开源驱动创新”睁开的“阳谋”。在焦点模子层面,除了打响名声的推理专用模子DeepSeek-R1,DeepSeek在3月又开源了通用模子V3.0324,其API成本仅为GPT-4的1/14,险些是以“倾销”的方法 ,将年夜 模子的使用成本打到了“地板价”。随后,融会 了代码与对话能力的DeepSeek-V2.5,以及多模态文生图模子Janus-Pro也接踵 开源。这一系列组合拳,让DeepSeek成为了国产AI技术普惠的症结 推动者之一。 在根本设施与工具链层面,DeepSeek同样进行了深度结构,开源了一系列旨在提拔练习和推理效率的症结 组件。例如,针对GPU优化的FlashMLA解码内核和DeepGEMM矩阵运算库,官方数据显示可提拔约30%的推理速度;为混淆专家(MoE)模子计划的DeepEP通信 库和DualPipe流水线算法,有效消沉 了分布 式练习的通信 延长;而名为3FS的超高速分布 式文件系统,则为年夜 模子练习提供了高效的数据读写支持。 尤为症结 的是,DeepSeek的开源并非仅仅停留在代码层面。他们敏锐地捕捉到了国产算力突起 的趋势。其开源的工具链不仅支持主流的英伟达GPU,还同步推出了适配华为昇腾平台的办理计划 (如MindIE镜像)。这一方法 有助于推动国产AI算力在现实运用 途 景中的落地,具有告急的财产代价。庞年夜 的开源系统 为DeepSeek带来了正向的生态循环 。全球开辟者基于其模子进行量化(如INT8/INT4版本),消沉 了摆设成本,并围绕医疗、金融等垂直行业进行微调,丰硕 了运用 途 景。 然而,这耀眼的A面,却无法掩盖其B面深入 的隐忧。R2的迟迟未能宣布 ,恰是 这些隐忧的会合表现。DeepSeek-R2的推迟,至少面对着三重困境。 首先是技术突破与算力供应的焦点矛盾。据英国《金融时报》等媒体报道,R1宣布 后,DeepSeek在干系方面的鼓励 下,曾尝试使用华为昇腾芯片进行下一代模子的练习。然而,从英伟达的CUDA生态迁徙到昇腾的CANN生态,其难度远超预期。练习过程中的不稳定和性能瓶颈,严峻拖慢了研发进度,乃至一度迫使团队将症结 练习任务切回NVIDIA平台。这场“算力长征”的艰巨,大概是导致R2延期的最直接、最焦点的技术身分 。 其次,资源的狂热与市场的超高预期,放年夜 了传言的传播效应,也给DeepSeek戴上了极重的“枷锁”。R1的乐成让DeepSeek成为了资源市场的骄子 ,估值水涨船高。每一次关于R2的传言,都能在资源市场掀起波澜。这种高度关注,既是动力也是压力,它迫使DeepSeek必须 拿出一款逾越性的产品 ,任何一点瑕疵都年夜 概被无穷放年夜 ,从而导致团队在宣布 决议上慎之又慎。 最后,在剧烈的行业竞争与中美技术角力的背景 下,组成 了R2宣布 最严峻的外部压力。在国内,阿里、百度等巨子 依附强盛的资源整合能力,在模子迭代、产品 落地和生态构建上步步紧逼。在国际上,美国对先辈AI技术的出口牵制 日益收紧。DeepSeek既要面对国内市场的“内卷”,又要应对国际情况的“脱钩”风险,其战略选择空间正变得越来越局促。 DeepSeek与梁文锋面对的“三重寻衅”当前,DeepSeek及其创始人梁文锋正不得不面对着来自技术、战略和市场三个层面的严峻寻衅,这种局势 使其在后续发展路径的选择上变得非常艰巨。 第一重寻衅,是如安在技术上实现自我逾越,即“创新者的窘境”。DeepSeek-R1在推理能力上的突出表现,已经为公司建立 了极高的技术标杆。这意味着R2必须 在性能上实现质的飞跃,而非简朴的参数提拔或通例优化,才能满足市场的等待。 假如R2的提拔幅度有限,很年夜 概碰面对类似于今年GPT-5宣布 后,行业广泛以为其创新力度不敷的评价。对于一家以技术驱动的创业公司而言,这种来自内部的、逾越自我的压力,是其决议过程中必须 考虑的主要身分 。 第二重寻衅,是公司在技术路线上的战略短板,特别是在多模态能力上的“缺位”。当前,全球顶尖年夜 模子的发展趋势已明白指向文本、图像、音频、视频等多模态能力的融会 。无论是经由过程 多模子能力调用协议(MCP)整合差别模子,照旧发展原生的多模态年夜 模子,都已成为行业共鸣 。 比拟 之下,DeepSeek至今宣布 和开源的模子仍重要会合在文本和代码领域,旗下多模态文生图模子Janus-Pro并未在行业掀起海浪 。这种技术路线上的单一性,年夜 概会使其在未来以多模态为焦点的运用 途 景竞争中处于倒霉职位,限定其生态的广度和商业化的想象空间。 而国内的另一家年夜 模子公司MiniMax为例,则走向了另一个非常:其从创业初期就专注于多模态技术,并已推出了成熟的产品 ,但囿于当前主流年夜 模子能力评估系统 ,仍以语言模子为基准。这使得 Minimax 在模子排名、社区承认度、学术引用等“行业标尺”上较为边缘,其开源的年夜 模子 MiniMax-M1,在Hugging Face等平台的活泼度远低于DeepSeek。其余 ,其主打的线性留意力机制与混淆专家系统(MoE)固然理论上具备效率优势 ,但在实践中尚未充分 验证其长期可控性和泛化能力,也让MiniMax 40亿美元估值屡遭质疑。 第三重寻衅,是必要面对DeepSeek面对的生态问题。自今年年中开始,网络中关于“DeepSeek变笨了”的批评辩论 不绝于耳,观察发明 固然R1模子在数学推理上表现优秀,但在涉及创意、事实性内容时却频繁出现 “幻觉”。 而这背后,正展现出DeepSeek在内容生态上的“先天”短板。年夜 型科技公司如百度、字节跳动等,其优势 不仅仅在于资金和技术,更在于其庞年夜 的流量进口 和内容生态系统。例如,百度拥有搜索、贴吧、文库等一系列产品 ,而字节跳动则有抖音、今日头条、西瓜视频等。这些平台不仅为用户提供了稳定的流量进口 ,更告急的是,在用户与内容交互的过程中,源源不绝地产生 着最新的、鲜活的数据。这些数据颠末洗濯和处置惩罚,可以连续地为年夜 模子提供高质量的练习语料,形成一个良性的“数据飞轮”——模子越好,用户越多,产生 的数据越新,模子迭代越快。 DeepSeek目前并不具备如许的内容生态优势 。其模子能力的提拔,更多依赖于外部公开数据集和互助方提供的数据,缺少 像百度、字节那样自有的、能够实时更新的“活水”。当模子在练习过程中无法有效甄别和洗濯受污染的语料时,就年夜 概导致“幻觉”征象的加剧。这种“幻觉”,不仅仅是简朴的信息编造,更年夜 概表现为逻辑杂乱、事实错误,乃至答非所问,这无疑严峻影响了用户的信任 感和使用体验。对于一个致力于商业化的年夜 模子来说,用户信任 是其产品 生命 线的基石,而“幻觉”问题,恰好是绵亘 在其商业化路径上的一年夜 障碍。 写在最后是以 ,对于梁文锋而言,是如何平衡内部研发节奏与外部市场竞争的压力。R2的延长宣布 ,为竞争敌手 提供了追赶和反超的时光 窗口。在快速变革的年夜 模子市场,技术领先的优势 稍纵即逝。梁文锋必须 在“寻求技术极致”与“抢占市场机遇”之间做出权衡。 宣布 一个性能未达内部最高标准但能及时卡位市场的产品 ,照旧继承打磨一个年夜 概错过最佳宣布 窗口的“完美”产品 ,这是一个艰巨的战略抉择。同时,叠加算力迁徙带来的工程寻衅,使得这一决议过程变得加倍 庞杂 。 不成 否认 ,DeepSeek-R1的宣布 对行业产生 了深远影响。它不仅证实了国内团队在焦点推理模子领域的研发实力,更告急的是,其开源计谋极年夜 地消沉 了AI技术的运用 成本,冲破了外洋少数厂商在高端模子领域的垄断,为推动全部 行业的创新和遍及做出了告急贡献。 在年夜 模子之家看来,DeepSeek当前所面对的困境,并非个例,而是国内顶尖AI公司在向更高技术水平迈进过程中广泛面对的寻衅缩影。市场等待R2的最终宣布 ,不仅是等待一款性能更强的模子,也是在视察 DeepSeek如安在技术瓶颈、战略短板和剧烈竞争的多重压力下,给出自己的办理计划 。DeepSeek和梁文锋给出的答案,也将对国内其他AI公司的发展路径提供告急的参考和启发 。 |
2025-05-03
2025-03-05
2025-02-26
2025-03-05
2025-02-26