9月29日晚间,国产人工智能(AI)本领 厂商深度求索(DeepSeek)公布正式公布 DeepSeek-V3.2-Exp模子,正如其名称所示的那样,这是一个基于V3.2实验性(Experimental)的版本。作为迈向新一代架构的中间步骤,Deepseek
![]() 9月29日晚间,国产人工智能(AI)本领 厂商深度求索(DeepSeek)公布正式公布 DeepSeek-V3.2-Exp模子,正如其名称所示的那样,这是一个基于V3.2实验性(Experimental)的版本。 作为迈向新一代架构的中间步骤,Deepseek V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(一种希奇注意力机制),针对长文本的训练和推理服从举行 了摸索 性的优化和验证。 据介绍,DeepSeek Sparse Attention(DSA)希奇注意力机制首次实现了细粒度希奇注意力机制,在几乎 不影响模子输出效果的前提下,实现了长文本训练和推理服从的大年夜 幅提拔。 ![]() 为了严谨地评估引入希奇注意力带来的影响,我们特意把 DeepSeek-V3.2-Exp 的训练设置与 V3.1-Terminus 举行 了严格的对齐。在各领域 的公开评测集上,DeepSeek-V3.2-Exp 的体现与 V3.1-Terminus 基本持平。 ![]() 目前,Deepseek官方 App、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp,同时 API 大年夜 幅度贬价。 值得注意的是,在DeepSeek-V3.2-Exp模子公布 的同一天,国产AI芯片大年夜 厂寒武纪就公布,已同步实现对DeepSeek-V3.2-Exp的适配,并开源大年夜 模子推理引擎vLLM-MLU源代码。 目前,开辟者可以在寒武纪软硬件平台上第一时间体验DeepSeek-V3.2-Exp的亮点。 寒武纪表现,公司一直重视 芯片和算法的联合创新,致力于以软硬件协同的方法 ,优化大年夜 模子摆设性能 ,降低摆设本钱。 此前,寒武纪对DeepSeek系列模子举行 了深入 的软硬件协同性能 优化,达成 了业界领先的算力利用率水平。 针对本次的DeepSeek-V3.2-Exp新模子架构,寒武纪通过Triton算子开辟实现了快速适配,利用BangC融合算子开辟实现了极致性能 优化,并基于计算与通信的并行计谋,再次达成 了业界领先的计算服从水平。 寒武纪表现,依托DeepSeek-V3.2-Exp带来的全新DeepSeek Sparse Attention机制,叠加寒武纪的极致计算服从,可大年夜 幅降低长序列场景下的训推本钱,共同为客户提供极具竞争力的软硬件办理筹划 。 编辑:芯智讯-浪客剑 |
2025-05-03
2025-03-05
2025-02-26
2025-03-05
2025-02-26