变天了!DeepSeek自砍一刀,AI代价腰斩

摘要

太卷了,又降价了!DeepSeek 这是铁了心要当 AI 圈的代价屠夫。最近(9 月 29 日晚),DeepSeek 官宣全新模型 V3.2-Exp 正式公布 并开源,紧接着,API 代价也跟着跳水。降价还不是象征性地降一点,而是直接腰斩:本钱

太卷了,又降价了!DeepSeek 这是铁了心要当 AI 圈的代价屠夫。

最近(9 月 29 日晚),DeepSeek 官宣全新模型 V3.2-Exp 正式公布 并开源,紧接着,API 代价也跟着跳水。

降价还不是象征性地降一点,而是直接腰斩:本钱直接砍失落 50% 以上,输出代价乃至暴跌 75%。

API 输入代价(缓存命中)从每百万 tokens 0.5 元降到 0.2 元,输出代价从 12 元砍到只剩 3 元,的确 是三折跳楼甩卖的力度。

而且是立刻生效,绝不拖泥带水,这波速度,属实带点国产厂商的豪爽气质。

这也让 DeepSeek 的 V3.2-Exp,成为了“性价比最高”的 API 之一。

其实老狐以为连之一都可以省略了,目前主流 AI 年夜 厂,能给到这个代价的,几乎一个没有。

网友们看完新报价直接发出灵魂拷问:“百万输出 3 块,这谁卷得过呀?”

值得一提的是,这波降价不是瞎搞促销,而是人家真在底层模型上做了优化。这一切的症结 ,是这次公布 的 V3.2-Exp 模型焦点立异 技术:DeepSeek Sparse Attention(希罕注意力机制,简称 DSA)。

为啥这玩意这么紧张?稍微跟狐友们科普一下:

听着很抽象对吧?但其实你可以把它想象成一种“聪明的省电模式”。传统的注意力机制是每个 token 都要跟其他所有 token 打招呼,一句话几十个字,它们内部得互相问好几十次,累不累?

当然累啊,不仅盘算慢,还特殊烧钱(你懂的,办事 器、GPU、电费、掩护 啥的都不是小钱)。

而 DSA 这个新招数呢?它只让紧张的 token 语言,不紧张的就主动闭麦,节省了年夜 批 盘算资源和时光 。

效果就是:推理更快了,本钱更低了,症结 是模型表现还没失落 链子,跟前一版本 V3.1-Terminus 的程度差不多。就是说,在不断送效果的前提下,成功把算力这口锅轻了好几斤。

为啥叫“Exp”?因为这是个实行性版本,意思是团队在探索新架构的路上,迈出的症结 一步,不是最终版本,但已经适用 到可以全面开用。以是你现在用到的 DeepSeek API,全都已经是这个新模型了。

如果你是开发者,恭喜你,没动代码,调用 本钱直接砍半,喜提史上最值更新。

如果你还想比较 下老模型的效果,DeepSeek也很知心地保留了 V3.1-Terminus 的 API 接口直到 10 月 15 日,修改 个 base_url 就能切换测试,不影响当前代价。

真学术范十足的支配 ,官方都劝你本身实测,不怕 PK,气力语言。

咱们再从开发者的角度,直白点说这波更新到底有多喷鼻 。

好比你做长文本处理惩罚的,文档摘要 、历史对话、代码分析这种,最怕的就是上下文太长,token 一多,代价跟着飙,跑一次你得夷由半天。

这回好了,DSA 专门优化了“长上下文”使命的推理服从,本钱一下就被拉下来了。再长的上下文也不消担忧 破产式调用 了,终于能扎实 跑年夜 使命了。

而从模型练习的角度,V3.2-Exp 的开发进程 其实也是科技感拉满。他们这次用的是“专家蒸馏+同一强化学习”双管齐下策略。

先是针对数学、编程、逻辑推理等多个领域,各自练习出了专精模型,再把这些“专家”的知识 整合进最终年夜 模型中(这波叫做蒸馏)。

然后在强化学习阶段,用一种新的 GRPO 策略(Group Relative Policy Optimization),把智能体本领、人类偏好(alignment)、推理程度全融合到一次练习中。

这样 练习有两个利益:

  1. 每个领域都不落下,机能 均衡

  2. 不会出现“新本领 学了,旧知识 忘了”的劫难性遗忘问题

更硬核的是,DeepSeek 还把 GPU 算子开源了,两套版本,TileLang 和 CUDA 全放出来了,研究 、部署、二开随你选,开源力度拉满。MIT协议 ,不限商用,真诚到拊膺切齿 。

你要做本地部署?也OK。Docker 镜像准备好了,还兼容各类 硬件平台,包括 NVIDIA H200、AMD MI350、乃至国产 NPU。

而这波重磅公布 的时光 点嘛……DeepSeek又一次选择了节前。

没错,他们是真的热爱在年夜 家放假前丢重磅炸弹。前有 V3.1、再有 Terminus,这次 V3.2-Exp 又赶在国庆之前放出,这公司更新节拍 ,堪比高铁发车。

不过,也不是没人质疑:你这频频都是“小步快跑”,真正的年夜 招呢?好比一直被等候的 V4、R2,什么时候上线?

乃至在 X(原推特)上就有外洋网友留言问 DeepSeek:“你们啥时候发 V4?”底下有人直接回:看这节拍 ,短期内怕是看不到。

其实从这次公布 内容来看,V3.2-Exp 已经是迈向 V4 的症结 中央步调了。

尤其是 DSA 架构的引入,为千亿参数级别的年夜 模型做了前期验证,等下一波年夜 范围 模型上线,很年夜 概就是在这个根本上完成的。

以是说,这波 DeepSeek 降价不仅不是“营销噱头”,反而更像是“提前放出未来技术红利”。你可以把 V3.2-Exp 看作一款“技术预告片”,但这预告片本身就已经能跑商用、能降本钱、还能开源拿去部署。

这放在环球 AI 厂商里,真没几个能做到。

有人说,在开源模型竞争白热化的本日,留住开发者靠的不是光说不练,而是连续优化体验+代价给到位+社区透明度高。这次 DeepSeek 显然是三管齐下,全拿下了。

比拟 之下,年夜 多半 厂商仍在拼参数、拼本领、拼精度,但 DeepSeek 选择了另一条更难模仿的道路:卷办事 本钱,卷研发服从,卷开源透明度

这种扎实 且高门槛的优势 ,才是真正构筑护城河的焦点。年夜 概,是时候从新 评估国产年夜 模型气力了。

0

路过

0

雷人

0

握手

0

鲜花

0

鸡蛋

推广
火星云矿 | 预约S19Pro,享500抵1000!
本文暂无评论,快来抢沙发!

有招是一个优质的生活妙招创作平台,在这里,你可以任意分享你的妙招经验,日常生活、技能学习、成长励志、恋爱婚姻……我们相信,每个人都有独特的生活妙招,有着无穷的创造力。
  • 官方手机版

  • 微信公众号

  • 商务合作