國內人工智慧獨角獸DeepSeek在全球爆紅,旗下開源大型語言模型DeepSeek V3與 推 理 模 型DeepSeek-R1的 成 本低廉,但性能媲美甚至超越OpenAI的o1及Meta的Llama, 受 到 市 場 高 度 關注,更有內媒對此形容引發矽谷震驚。 DeepSeek創辦人梁文鋒表示,希望DeepSeek幫助形成創新文化,但認為先進芯片禁運仍是眼前難題。國務院總理李強聽取DeepSeek創始人梁文鋒的意見。(央視新聞視頻截圖)
總部位於中國杭州的人工智能(AI)大模型DeepSeek近日爆紅!該應用程式在蘋果應用商店(App Store)美國區免費排行榜排名第六位,已超越Google Gemini、Microsoft Copilot等美國生成式AI產品,受到市場高度關注。
傳Meta整個AI部門陷焦慮國內初創AI公司DeepSeek近日對外正式發表DeepSeek-R1模型,因性能與OpenAI最新的o1相媲美,引發轟動。(美聯社資料圖片)
近日一篇在匿名平台teamblind上發佈的文章遭瘋傳,有一位自稱是Meta員工稱公司內部因DeepSeek模型而進入恐慌模式,並提到「 DeepSeek-V3 」在基準測試中,已經讓(Meta推出的)Llama 4相形見絀,而更讓人難堪的是一家「僅用550萬美元訓練預算的中國公司」就做到這一點。
該帖文又指,Meta工程師正爭分奪秒分析DeepSeek,試圖複製其中的一切可能技術;而「 DeepSeek-R1 」的出現,也讓情況更加嚴峻。
此 外,AI科 技 新 創 公 司Scale AI創 辦 人Alexandr Wang接受媒體採訪時表示,DeepSeek的AI大模型效能大致與美國最好的模型相當;過去十年美國可能一直在AI競賽中領先中國,但DeepSeek可能會「改變一切」。
創辦人:先進芯片禁運仍屬難題
翻查資料顯示,DeepSeek創辦人梁文鋒甚少接受訪問,去年7月內地媒體「 36氪」刊登梁文鋒的長篇專訪,由他親身講述中國AI現况。他認為中國過往30多年科網浪潮中,中國沒有真正參與創新,希望DeepSeek幫助形成創新文化,幫中國走出模仿別人的困局,但認為先進芯片禁運仍是眼前難題。
梁文鋒當時又表示,DeepSeek短期內無融資計劃,但研發預算充足,他表示,DeepSeek面臨的問題從來不是錢,而是高端芯片被禁運。被問到大廠是否可用科技拉開差距時,梁文鋒指「技術沒有秘密」,如Nvidia的顯示卡技術「很容易複製」,但重組團隊及追趕下一代技術都需要時間,「所以實際(大廠)的護城河還是很寬。」
上周一,國務院總理李强主持召開專家、企業家和教科文衛體等領域代表座談會,就工作報告聽取意見,梁文鋒列席其中。