中國AI大模型開發商DeepSeek在24日晚上悄然推出新版模型DeepSeek-V3-0324,雖非外界預期中的R2版本,但已展現出接近Claude 3.7的整體實力。新版模型在編碼、數學推理及語言表達等多方面均有顯著提升,並採用 MIT 開源協議免費提供,引發網友廣泛關注與討論。
據中國科技媒體《智東西》報道,DeepSeek-V3 在多項AI測試中表現出色。一位海外AI部落客指出,新版模型終於能在代碼領域與Anthropic的Claude Sonnet 3.5正面交鋒,甚至在某些應用場景中更具優勢。此前Claude系列在程序員圈中聲譽極高,長期被視為程式生成與理解能力最強的模型之一。
實測顯示,當輸入「設計一個美觀的個人部落格網站,帶有科技感,直接開發成可用網頁」的指令時,DeepSeek-V3能在短短兩分鐘內生成逾400行 HTML/CSS/JavaScript程式碼,建構出一個具備粒子背景動畫、賽博龐克風格 UI、響應式設計的完整網站。相比之下,舊版模型僅生成約100行簡單程式碼,無論在設計美感還是功能完整度上皆明顯遜色。
數學方面,DeepSeek-V3 也有明顯進步。當面對舊版本無法解出的數學題時,新模型雖未總是給出正確答案,但其推理步驟更加詳細,且具有一定自我反思與修正能力,輸出的token數量亦大幅增加,顯示出其更強的邏輯與推理深度。
能夠深度回答跨領域問題
除編碼與數學外,新版模型在處理語言及知識整合問題方面也顯示出長足進展。例如針對「Bushman喝不喝牛奶?」這類文化與生理學交叉的問題,DeepSeek-V3 不僅能回答出結論,還補充相關背景、文化差異與學術觀點,顯示出更完整且結構化的回答能力。相較之下,舊版模型僅提供簡略回應,未能捕捉問題深層含義。
更引人注目的是,新版DeepSeek-V3不僅性能逼近 Claude 3.7,甚至在某些領域已可一較高下,卻依然採取完全免費策略。許多經常遭 Claude 封號的用戶紛紛表示感動,有X網友戲稱這等於是「白送法拉利」。尤其值得一提的是,DeepSeek-V3 採用MIT開源協議,開放程度遠超前代自定義許可證,允許用戶自由修改、蒸餾、甚至商業化使用,對AI生態圈是一大激勵。
對話過於冷靜理性
不過,也有部分用戶指出,新模型在多輪對話中表現過於「冷靜理性」,風格明顯偏向機械,缺乏人情味與互動樂趣,連表情符號都不願添加。
外界普遍推測,DeepSeek-R2很可能在未來數周內登場。若R2延續R1的強悍基礎,再加上V3所展示的進步幅度,有機會對抗尚未發布的GPT-5,進一步打破 OpenAI 壟斷地位。儘管目前官方尚未公布新版模型的系統卡,技術細節仍未完全揭曉,但 DeepSeek已憑藉V3再次在全球AI社群中掀起波瀾。(編輯部)