在 DeepSeek 掀起的这轮开源模子海潮中,有一个开源王者好像被忘记了——Meta AI。今天破晓, Meta 忽然掏出了 Llama 4。 💡 Llama 4 全系接纳混淆专家(MoE)架构,现在最强的开源多模态大模子 ✏️划重点:文本、
在 DeepSeek 掀起的这轮开源模子海潮中,有一个开源王者好像被忘记了——Meta AI。 今天破晓, Meta 忽然掏出了 Llama 4。 💡 Llama 4 全系接纳混淆专家(MoE)架构,现在最强的开源多模态大模子 ✏️划重点:文本、图像与视频的万能选手 Llama 4 Scout 📌 面向文档摘要与大型代码库推理使命,专为高效信息提取与复杂逻辑推理打造。 🔢 共有 1090 亿参数,170 亿激活参数量 🔍 高低 文长度 1000 万 tokens(现在行业最长) Llama 4 Maverick 📌 以通用助手与聊天 运用 为焦点,具备顶级的多语言 支撑 与编程能力。 🔢 共有 4000 亿参数,170 亿激活参数量,分布 于 128个专家模块 🥇 在大模子竞技场(Arena)中突破 1400 分,总排名第二;其中开放模子逾越 DeepSeek V3 排名第一。 下载 🔗 https://www.llama.com/llama-downloads/ 值得一提的是,Llama 4 Scout 利用 Int4 量化就可以在单个 H100 GPU 上运行,Llama 4 Maverick 则可以直接在 H100 主机上运行。 Llama 4 Behemoth(预览) 📌 将来最强盛的 AI 模子之一,具备令人瞩目标超大规模参数架构。 🔢 2880 亿激活参数量,总参数 2 万亿(消耗级根本跑不动) 🚀 目标:在多模态处理惩罚与推理能力上实现突破 ❓ 这么庞大的模子训练需要巨量计算资本 和韶光 ,据悉在推理和数学使命等技能基准上仍未达预期。 APPSO 发现,此次 的宣布 多少 有些赶鸭子上架,2 万亿参数的性能猛兽 Llama 4 Behemoth 还是期货,可见在耗费巨额资金训练后依然不够 竞争力。 年初曾有消息称 DeepSeek 让 Meta AI 团队陷入恐慌 : 「当生成式 AI 构造中的每个高管薪资都比训练整个 DeepSeek-V3 的资本还要高,而我们有好几十个这样的高管,他们要如何面对高层?」 开源模子已经显现出对抗 OpenAI 等闭源模子的能力,但 Meta 的开源王者职位开始动摇(别忘了另有 Qwen),今年 的开源模子竞争渐渐白热化。 DeepSeek 前两天悄悄宣布 了新论文,也许 R2 已经在路上。 ![]() ![]() ![]() ![]() ![]() ![]() |
2025-03-05
2025-03-03
2025-03-05
2025-03-03
2025-02-26