Meta發布Llama 4模型

表現與DeepSeek-V3 相當
08/04/2025
23439
收藏
分享
表現與DeepSeek-V3 相當

Meta公司7日宣布推出新一代多模態人工智能模型 Llama 4系列,並將其整合至 WhatsApp、Messenger、Instagram 及網頁版的Meta AI助理中。

目前,兩款新模型 Llama 4 Scout和Llama 4 Maverick已可在官方網站 llama.com 或 Hugging Face 平台下載。其中,Llama 4 Scout 擁有170 億有效參數和 4,000 億總參數,可在單一 英偉達 H100 GPU 上運行,並在多項基準測試中超越 Google 的 Gemma 3、Gemini 2.0 Flash-Lite 及 Mistral 3.1。Llama 4 Maverick 的性能則媲美 OpenAI 的 GPT-4o 和 Google 的Gemini 2.0 Flash,且在程式設計與推理任務中,使用的有效參數不到一半,表現與DeepSeek-V3相當,可在單一 H100 DGX主機上運行,便於部署。

此外,Meta正在訓練名為 Llama 4 Behemoth 的模型,該模型將擁有2,880億有效參數,總參數達兩萬億。雖然尚未正式推出,但Meta表示,該模型在多項 STEM 基準測試中,將能超越競爭對手如 GPT-4.5、Claude Sonnet 3.7 及 Gemini 2.0 Pro。

Meta 強調,Llama 4採用了混合專家模型(MoE)架構,在訓練和推理方面具有更高的運算效率。公司計劃在4月29日舉行的LlamaCon 開發者大會上,進一步探討其 AI模型和產品的未來計劃。(編輯部)

檢舉
檢舉類型:
具體描述:
提交
取消
評論
發佈

力報會員可享用評論功能

註冊 / 登錄

查看更多評論
收藏
分享

相關新聞

推薦新聞

找不到相關內容

七日預報