亚洲成A人V欧美综合天堂麻豆,曝光视频网站无码专区被判刑,亚洲另类国产精品一区二区,影院无码人妻精品一区二区,又湿又紧又大又爽A片视频

<rt id="wx2cd"><form id="wx2cd"><dl id="wx2cd"></dl></form></rt>

<blockquote id="wx2cd"><i id="wx2cd"></i></blockquote><cite id="wx2cd"><rp id="wx2cd"></rp></cite>

當(dāng)前位置：首頁 > Meta-LIama-4-重奪開源第一：DeepSeek-同等代碼能力但參數(shù)減半-一張-H100-就能跑-還有兩萬億參數(shù)超大杯

Meta-LIama-4-重奪開源第一：DeepSeek-同等代碼能力但參數(shù)減半-一張-H100-就能跑-還有兩萬億參數(shù)超大杯

作者：龍星手游網(wǎng) 發(fā)布時間：2025-04-07 15:42:05

AI 不過周末，硅谷也是如此。大周日的，Llama 家族上新，一群 LIama 4 就這么突然發(fā)布了。

這是 Meta 首個基于 MoE 架構(gòu)模型系列，目前共有三個款：

Llama 4 Scout、Llama 4 Maverick、Llama 4 Behemoth。

最后一個尚未推出，只是預(yù)告，但 Meta 已經(jīng)毫不避諱地稱前兩者是“我們迄今為止最先進(jìn)的型號，也是同類產(chǎn)品中最好的多模態(tài)型號”。

詳細(xì)來看一些關(guān)鍵詞 ——

Llama 4 Scout，16 位專家的 170 億激活參數(shù)的多模態(tài)模型，單個 H100 GPU 可運(yùn)行，同類 SOTA，并擁有 10M 上下文窗口。

Llama 4 Maverick，128 位專家的 170 億激活參數(shù)多模態(tài)模型，擊敗 GPT-4o 和 Gemini 2.0 Flash，與 DeepSeek-V3 同等代碼能力參數(shù)只要一半，主打與 DeepSeek 一樣的性價比，單個 H100 主機(jī)即可運(yùn)行。

Llama 4 Behemoth：2 萬億參數(shù)的超大超強(qiáng)模型，以上二者都由這個模型蒸餾而來；目前還在訓(xùn)練中；多個基準(zhǔn)測試超過 GPT-4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro。

Meta

Meta 官推激情表示，這些 Llama 4 模型標(biāo)志著 Llama 生態(tài)系統(tǒng)新時代 —— 原生多模態(tài) AI 創(chuàng)新的開始。

Meta

與此同時，大模型競技場排名迎來一輪更新。

此次發(fā)布的 Llama 4 Maverick，在困難提示、編碼、數(shù)學(xué)、創(chuàng)意寫作方面并列第一；得分 1417，不僅大大超越了此前 Meta 自家的 Llama-3-405B（提升了 149 分），還成為史上第 4 個突破 1400 分的模型；。

而且跑分明確 —— 超越 DeepSeek-V3，實(shí)現(xiàn)亮相即登頂，直接成為排名第一的開源模型。

Meta

谷歌 CEO 劈柴哥第一時間發(fā)來賀電：

AI 世界，從不平淡！

恭喜呀！前進(jìn)吧，Llama 4 團(tuán)隊！

Meta

中杯、大杯首批亮相

了解了 Llama 4 家族全體成員后，我們先來見識一下首批發(fā)布的 2 個模型：

中杯

：Llama 4 Scout（偵查兵 Llama 4）。

大杯

：Llama 4 Maverick（特立獨(dú)行的 Llama 4）。

兩者均已能在 Llama 官網(wǎng)和抱抱臉上下載。

Meta

我們抓取并提煉出這倆模型的一些特點(diǎn)：

Meta 首批 MoE 架構(gòu)模型

這是 Llama 系列，第一批使用 MoE（混合專家模型）構(gòu)建的模型。

中杯 Llama 4 Scout 有 17B 激活參數(shù)，擁有 16 個專家模型。

大杯 Llama 4 Maverick 擁有 17B 激活參數(shù)，擁有 128 個專家模型。

至于還沒和大家正式見面的超大杯 Llama 4 Maverick，擁有 288B 激活參數(shù)，擁有 16 個專家模型。

非常長 ———— 的上下文

Llama 4 系列，均具有很長的上下文窗口。

這一點(diǎn)主要體現(xiàn)在 Meta 公布的中杯 Llama 4 Scout 的詳細(xì)數(shù)據(jù)里：

Llama 4 Scout 提供了行業(yè)領(lǐng)先的 100 萬上下文窗口。

經(jīng)過預(yù)訓(xùn)練和后訓(xùn)練，Llama 4 Scout 長度為 256K，這使基本模型具有高級長度泛化能力。

這個配置，讓它在廣泛的測評集上，比 Gemma 3、Gemini 2.0 Flash-Lite 和 Mistral 3.1 的結(jié)果更優(yōu)秀。

Meta

它在「大海撈針」測試上的表現(xiàn)如下：

Meta

結(jié)果如下：

Meta

那么之前的 Llama 系列模型的上下文窗口情況呢？

Llama 1，上下文窗口為 2k；

Llama 2，上下文窗口默認(rèn)為 4k，但可以通過微調(diào)等可以拓展到 32k；

Llama 3，上下文窗口是 8k，后來 Llama 3.1 的長文本能力拓展到了 128k。

Meta 官方博客中是這么寫的：

（Llama 4 的長上下文）開辟了一個充滿可能性的世界，包括多文檔摘要、解析廣泛的用戶活動以執(zhí)行個性化任務(wù)以及對龐大的代碼庫進(jìn)行推理。

原生多模態(tài)設(shè)計

Llama 4 系列，開啟了 Llama 的原生多模態(tài)時代。

而已經(jīng)公開對外的中杯和大杯，被官方稱為“輕量級原生多模態(tài)模型”。

給用戶的體驗(yàn)就是，上傳一張圖片，可以直接在對話框中提問關(guān)于這張圖片的各種問題。

不是我說，Llama 終于長眼睛了?。?！

Meta

相關(guān)文章

一騎當(dāng)千-勇闖上京！西山居經(jīng)典武俠手游劍俠情緣·零副本介紹

魔獸世界刺殺賊pve宏命令代碼詳細(xì)一覽

雙影奇境第七章如何解鎖獎杯成就-雙影奇境第七章獎杯成就對照表

地下城443是什么意思探秘地下城的神秘代碼與玩法解析

2024王者榮耀kpl夏季賽季后賽day10誰贏了-2024王者榮耀kpl夏季賽季后賽day10獲勝隊伍說明

如何在星辰影院暢享最佳觀影體驗(yàn)：探索電影資源與會員福利

劍靈2攻略-劍靈2手游玩法攻略

率土之濱百家邀請賽怎么參加-2023率土之濱百家邀請賽報名方法

豐滿的-子2理倫身搖曳靈動演變-網(wǎng)友：身材火辣驚艷全場太勾魂了！

國產(chǎn)圃碼秘麻麻在線播放-網(wǎng)友：這真的是一場視覺盛宴！

官方推薦

一騎當(dāng)千-勇闖上京！西山居經(jīng)典武俠手游劍俠情緣·零副本介紹

2025-04-02 18:03:50

魔獸世界刺殺賊pve宏命令代碼詳細(xì)一覽

2025-04-02 19:08:52

雙影奇境第七章如何解鎖獎杯成就-雙影奇境第七章獎杯成就對照表

2025-04-05 17:42:26

地下城443是什么意思探秘地下城的神秘代碼與玩法解析

2025-04-05 20:04:22

2024王者榮耀kpl夏季賽季后賽day10誰贏了-2024王者榮耀kpl夏季賽季后賽day10獲勝隊伍說明

2025-04-06 22:16:18

猜你喜歡

韓國電影巜試衣間里的放蕩-揭示人性的復(fù)雜-網(wǎng)友:-真實(shí)又深刻的情感沖突！

2025-04-07 15:42:06

Meta-LIama-4-重奪開源第一：DeepSeek-同等代碼能力但參數(shù)減半-一張-H100-就能跑-還有兩萬億參數(shù)超大杯

2025-04-07 15:42:05

單身媽媽韓劇全集完整版-講述溫暖故事-網(wǎng)友：情感共鳴真深刻！

2025-04-07 15:41:29

紙嫁衣2奘鈴村打開傘方法一覽

2025-04-07 15:37:15

9.1免費(fèi)網(wǎng)站nba引爆熱潮-網(wǎng)友：你絕對不想錯過這場盛宴！

2025-04-07 15:36:22

Copyright ? 2025 龍星手游網(wǎng)

皖I(lǐng)CP備17007091號-2 聯(lián)系郵箱：[email protected] 網(wǎng)站地圖

抵制不良游戲，拒絕盜版游戲。注意自我保護(hù)，謹(jǐn)防受騙上當(dāng)。適度游戲益腦，沉迷游戲傷身。合理安排時間，享受健康生活

<ul id="wdqw5"><blockquote id="wdqw5"></blockquote></ul>

<dfn id="wdqw5"><pre id="wdqw5"><th id="wdqw5"></th></pre></dfn>

<s id="wdqw5"><i id="wdqw5"><wbr id="wdqw5"></wbr></i></s>