Meta發布Llama 4模型表現與DeepSeek-V3 相當

Meta發布Llama 4模型

表現與DeepSeek-V3 相當

08/04/2025

23439

Meta公司7日宣布推出新一代多模態人工智能模型 Llama 4系列，並將其整合至 WhatsApp、Messenger、Instagram 及網頁版的Meta AI助理中。

目前，兩款新模型 Llama 4 Scout和Llama 4 Maverick已可在官方網站 llama.com 或 Hugging Face 平台下載。其中，Llama 4 Scout 擁有170 億有效參數和 4,000 億總參數，可在單一英偉達 H100 GPU 上運行，並在多項基準測試中超越 Google 的 Gemma 3、Gemini 2.0 Flash-Lite 及 Mistral 3.1。Llama 4 Maverick 的性能則媲美 OpenAI 的 GPT-4o 和 Google 的Gemini 2.0 Flash，且在程式設計與推理任務中，使用的有效參數不到一半，表現與DeepSeek-V3相當，可在單一 H100 DGX主機上運行，便於部署。

此外，Meta正在訓練名為 Llama 4 Behemoth 的模型，該模型將擁有2,880億有效參數，總參數達兩萬億。雖然尚未正式推出，但Meta表示，該模型在多項 STEM 基準測試中，將能超越競爭對手如 GPT-4.5、Claude Sonnet 3.7 及 Gemini 2.0 Pro。

Meta 強調，Llama 4採用了混合專家模型（MoE）架構，在訓練和推理方面具有更高的運算效率。公司計劃在4月29日舉行的LlamaCon 開發者大會上，進一步探討其 AI模型和產品的未來計劃。（編輯部）

表現與DeepSeek-V3 相當