Meta 突袭开源 Llama 4 超 DeepSeek V3!千万高低 文革新记录,2 万亿性能巨兽在路上

摘要

在 DeepSeek 掀起的这轮开源模子海潮中,有一个开源王者好像被忘记了——Meta AI。今天破晓, Meta 忽然掏出了 Llama 4。 💡 Llama 4 全系接纳混淆专家(MoE)架构,现在最强的开源多模态大模子 ✏️划重点:文本、

在 DeepSeek 掀起的这轮开源模子海潮中,有一个开源王者好像被忘记了——Meta AI。

今天破晓, Meta 忽然掏出了 Llama 4。

💡 Llama 4 全系接纳混淆专家(MoE)架构,现在最强的开源多模态大模子

✏️划重点:文本、图像与视频的万能选手

Llama 4 Scout

📌 面向文档摘要与大型代码库推理使命,专为高效信息提取与复杂逻辑推理打造。

🔢 共有 1090 亿参数,170 亿激活参数量

🔍 高低 文长度 1000 万 tokens(现在行业最长)

Llama 4 Maverick

📌 以通用助手与聊天 运用 为焦点,具备顶级的多语言 支撑 与编程能力。

🔢 共有 4000 亿参数,170 亿激活参数量,分布 于 128个专家模块

🥇 在大模子竞技场(Arena)中突破 1400 分,总排名第二;其中开放模子逾越 DeepSeek V3 排名第一。

下载 🔗

https://www.llama.com/llama-downloads/

值得一提的是,Llama 4 Scout 利用 Int4 量化就可以在单个 H100 GPU 上运行,Llama 4 Maverick 则可以直接在 H100 主机上运行。

Llama 4 Behemoth(预览)

📌 将来最强盛的 AI 模子之一,具备令人瞩目标超大规模参数架构。

🔢 2880 亿激活参数量,总参数 2 万亿(消耗级根本跑不动)

🚀 目标:在多模态处理惩罚与推理能力上实现突破

❓ 这么庞大的模子训练需要巨量计算资本 和韶光 ,据悉在推理和数学使命等技能基准上仍未达预期。

APPSO 发现,此次 的宣布 多少 有些赶鸭子上架,2 万亿参数的性能猛兽 Llama 4 Behemoth 还是期货,可见在耗费巨额资金训练后依然不够 竞争力。

年初曾有消息称 DeepSeek 让 Meta AI 团队陷入恐慌 :

「当生成式 AI 构造中的每个高管薪资都比训练整个 DeepSeek-V3 的资本还要高,而我们有好几十个这样的高管,他们要如何面对高层?」

开源模子已经显现出对抗 OpenAI 等闭源模子的能力,但 Meta 的开源王者职位开始动摇(别忘了另有 Qwen),今年 的开源模子竞争渐渐白热化。

DeepSeek 前两天悄悄宣布 了新论文,也许 R2 已经在路上。

0

路过

0

雷人

0

握手

0

鲜花

0

鸡蛋

推广
火星云矿 | 预约S19Pro,享500抵1000!
本文暂无评论,快来抢沙发!

有招是一个优质的生活妙招创作平台,在这里,你可以任意分享你的妙招经验,日常生活、技能学习、成长励志、恋爱婚姻……我们相信,每个人都有独特的生活妙招,有着无穷的创造力。
  • 官方手机版

  • 微信公众号

  • 商务合作