变天了！DeepSeek自砍一刀，AI代价腰斩

首页 ›今日热点 ›科技财经

收藏分享邀请

摘要

太卷了，又降价了！DeepSeek 这是铁了心要当 AI 圈的代价屠夫。最近（9 月 29 日晚），DeepSeek 官宣全新模型 V3.2-Exp 正式公布并开源，紧接着，API 代价也跟着跳水。降价还不是象征性地降一点，而是直接腰斩：本钱

太卷了，又降价了！DeepSeek 这是铁了心要当 AI 圈的代价屠夫。

最近（9 月 29 日晚），DeepSeek 官宣全新模型 V3.2-Exp 正式公布并开源，紧接着，API 代价也跟着跳水。

降价还不是象征性地降一点，而是直接腰斩：本钱直接砍失落 50% 以上，输出代价乃至暴跌 75%。

API 输入代价（缓存命中）从每百万 tokens 0.5 元降到 0.2 元，输出代价从 12 元砍到只剩 3 元，的确是三折跳楼甩卖的力度。

而且是立刻生效，绝不拖泥带水，这波速度，属实带点国产厂商的豪爽气质。

这也让 DeepSeek 的 V3.2-Exp，成为了“性价比最高”的 API 之一。

其实老狐以为连之一都可以省略了，目前主流 AI 年夜厂，能给到这个代价的，几乎一个没有。

网友们看完新报价直接发出灵魂拷问：“百万输出 3 块，这谁卷得过呀？”

值得一提的是，这波降价不是瞎搞促销，而是人家真在底层模型上做了优化。这一切的症结，是这次公布的 V3.2-Exp 模型焦点立异技术：DeepSeek Sparse Attention（希罕注意力机制，简称 DSA）。

为啥这玩意这么紧张？稍微跟狐友们科普一下：

听着很抽象对吧？但其实你可以把它想象成一种“聪明的省电模式”。传统的注意力机制是每个 token 都要跟其他所有 token 打招呼，一句话几十个字，它们内部得互相问好几十次，累不累？

当然累啊，不仅盘算慢，还特殊烧钱（你懂的，办事器、GPU、电费、掩护啥的都不是小钱）。

而 DSA 这个新招数呢？它只让紧张的 token 语言，不紧张的就主动闭麦，节省了年夜批盘算资源和时光。

效果就是：推理更快了，本钱更低了，症结是模型表现还没失落链子，跟前一版本 V3.1-Terminus 的程度差不多。就是说，在不断送效果的前提下，成功把算力这口锅轻了好几斤。

为啥叫“Exp”？因为这是个实行性版本，意思是团队在探索新架构的路上，迈出的症结一步，不是最终版本，但已经适用到可以全面开用。以是你现在用到的 DeepSeek API，全都已经是这个新模型了。

如果你是开发者，恭喜你，没动代码，调用本钱直接砍半，喜提史上最值更新。

如果你还想比较下老模型的效果，DeepSeek也很知心地保留了 V3.1-Terminus 的 API 接口直到 10 月 15 日，修改个 base_url 就能切换测试，不影响当前代价。

真学术范十足的支配，官方都劝你本身实测，不怕 PK，气力语言。

咱们再从开发者的角度，直白点说这波更新到底有多喷鼻。

好比你做长文本处理惩罚的，文档摘要、历史对话、代码分析这种，最怕的就是上下文太长，token 一多，代价跟着飙，跑一次你得夷由半天。

这回好了，DSA 专门优化了“长上下文”使命的推理服从，本钱一下就被拉下来了。再长的上下文也不消担忧破产式调用了，终于能扎实跑年夜使命了。

而从模型练习的角度，V3.2-Exp 的开发进程其实也是科技感拉满。他们这次用的是“专家蒸馏+同一强化学习”双管齐下策略。

先是针对数学、编程、逻辑推理等多个领域，各自练习出了专精模型，再把这些“专家”的知识整合进最终年夜模型中（这波叫做蒸馏）。

然后在强化学习阶段，用一种新的 GRPO 策略（Group Relative Policy Optimization），把智能体本领、人类偏好（alignment）、推理程度全融合到一次练习中。

这样练习有两个利益：

每个领域都不落下，机能均衡
不会出现“新本领学了，旧知识忘了”的劫难性遗忘问题

更硬核的是，DeepSeek 还把 GPU 算子开源了，两套版本，TileLang 和 CUDA 全放出来了，研究、部署、二开随你选，开源力度拉满。MIT协议，不限商用，真诚到拊膺切齿。

你要做本地部署？也OK。Docker 镜像准备好了，还兼容各类硬件平台，包括 NVIDIA H200、AMD MI350、乃至国产 NPU。

而这波重磅公布的时光点嘛……DeepSeek又一次选择了节前。

没错，他们是真的热爱在年夜家放假前丢重磅炸弹。前有 V3.1、再有 Terminus，这次 V3.2-Exp 又赶在国庆之前放出，这公司更新节拍，堪比高铁发车。

不过，也不是没人质疑：你这频频都是“小步快跑”，真正的年夜招呢？好比一直被等候的 V4、R2，什么时候上线？

乃至在 X（原推特）上就有外洋网友留言问 DeepSeek：“你们啥时候发 V4？”底下有人直接回：看这节拍，短期内怕是看不到。

其实从这次公布内容来看，V3.2-Exp 已经是迈向 V4 的症结中央步调了。

尤其是 DSA 架构的引入，为千亿参数级别的年夜模型做了前期验证，等下一波年夜范围模型上线，很年夜概就是在这个根本上完成的。

以是说，这波 DeepSeek 降价不仅不是“营销噱头”，反而更像是“提前放出未来技术红利”。你可以把 V3.2-Exp 看作一款“技术预告片”，但这预告片本身就已经能跑商用、能降本钱、还能开源拿去部署。

这放在环球 AI 厂商里，真没几个能做到。

有人说，在开源模型竞争白热化的本日，留住开发者靠的不是光说不练，而是连续优化体验+代价给到位+社区透明度高。这次 DeepSeek 显然是三管齐下，全拿下了。

比拟之下，年夜多半厂商仍在拼参数、拼本领、拼精度，但 DeepSeek 选择了另一条更难模仿的道路：卷办事本钱，卷研发服从，卷开源透明度。

这种扎实且高门槛的优势，才是真正构筑护城河的焦点。年夜概，是时候从新评估国产年夜模型气力了。

路过

雷人

握手

鲜花

鸡蛋

忠魁

关注Ta

推广

火星云矿 | 预约S19Pro，享500抵1000！

上一篇：AI当高等白领牛马，哪家年夜模型最强

下一篇：1 元洗车、0 元购奶茶，互联网烧钱的这十年留下了啥？

本文暂无评论，快来抢沙发!

您还未登录：
登录账号
立即注册

忠魁关注Ta

0 粉丝25 主题

该作者很懒，什么也没有填写

变天了！DeepSeek自砍一刀，AI代价腰斩

火星云矿 | 预约S19Pro，享500抵1000！

荣昌当局食堂主厨都炒麻了：连炒十三四个小时，均匀一人炒18

2025年3月4日晚上，共有3名老虎落马，大快人心，这是人民的

《难哄》vs《偷偷藏不住》，5个角色不同演员对比，伤害太大

胆大包天！女子冒充亲友混进喜宴，偷窃礼金被抓包，遭群殴后

杨颖最新大片下巴有凹坑，体型过瘦状态疲惫，强凹少女感好尴

变天了！DeepSeek自砍一刀，AI代价腰斩

火星云矿 | 预约S19Pro，享500抵1000！

荣昌当局食堂主厨都炒麻了：连炒十三四个小时，均匀 一人炒18

2025年3月4日晚上，共有3名老虎落马，大快人心 ，这是人民的

《难哄》vs《偷偷藏不住》，5个角色不同演员对比，伤害太大

胆大包天！女子冒充亲友混进喜宴，偷窃礼金被抓包，遭群殴后

杨颖最新大片下巴有凹坑，体型过瘦状态疲惫，强凹少女感好尴

荣昌当局食堂主厨都炒麻了：连炒十三四个小时，均匀一人炒18

2025年3月4日晚上，共有3名老虎落马，大快人心，这是人民的