隨AI代理Manus爆火浮上檯面 開源工具 Browser Use能讀懂網頁

開源工具 Browser Use能讀懂網頁
08/04/2025
18735
收藏
分享
開源工具 Browser Use能讀懂網頁

人工智能代理平台Manus近期迅速爆紅,其背後核心開源工具Browser Use也隨之登上技術舞台,成為開發圈熱門話題。Browser Use 的突破點,在於它讓AI「讀懂」網站結構,而非單靠視覺模擬,大幅提升任務操作的穩定性與靈活性。這項由兩位碩士生四天完成的原型,短時間內吸引全球開發者關注,更獲得1,700萬美元投資,正式邁向商業化。

隨著AI代理(AI Agent)逐漸成為新一代人工智能應用的熱門領域,許多新創團隊積極開發能自主操作網站的AI工具,但多數解法仍仰賴截圖與座標模擬方式進行操作,當網站稍有變動便容易失效。Browser Use 則採取完全不同的策略,不靠視覺模擬,而是將網站互動元素如按鈕、表單等,轉譯為語意化、結構化的文字格式,讓語言模型能像理解自然語言一樣理解網站邏輯。

這項突破讓AI能更精確執行登入、下載報表、填表等操作,並支援分頁切換、模擬滑鼠鍵盤輸入、存取本地檔案等功能,大幅拓展AI代理的應用可能。使用者只需輸入簡單任務指令,即可讓AI如人類般完成整個操作流程,解決了傳統網頁自動化流程易壞、難維護的痛點。

Browser Use共同創辦人Gregor Žunič指出,這樣的設計讓AI不再只是「模仿人類操作」,而是「理解網頁意圖」後主動行動,真正具備智慧代理的核心能力。該專案的介紹文章在X平台瀏覽量突破240萬,GitHub星標超過五萬顆,成為開源社群焦點。

獲1,700萬美元資金

Browser Use 的雛形,其實只是瑞士蘇黎世聯邦理工學院兩位資料科學碩士生 Magnus Müller 與 Gregor Žunič 在一次午餐聊天中的靈感。他們在創新加速器「Student Project House」相識後,花四天時間打造出最小可行產品(MVP),並上傳至 GitHub 與 Hacker News,迅速獲得熱烈迴響。

初期,Browser Use 僅提供開源版本供開發者部署。隨著使用者需求暴增,團隊也順勢推出雲端服務版本,每月訂價30美元,整合IP切換、驗證碼處理、自動登入等功能,讓使用者免除繁瑣設定即可上手。

這波熱潮不僅吸引開發者,也引來資本市場青睞。Browser Use 在種子輪募資中獲得1,700萬美元資金,由創投Felicis領投,Paul Graham、Nexus Venture Partners 等知名投資人參與。Felicis合夥人Astasia Myers表示,Browser Use展現了開源優先與代理型AI應用的潛力,加上團隊執行力強,是投資的重要原因。

團隊未來將進一步開發語音操作、任務排程、自動重試等功能,並推出API介面,幫助開發者更容易整合AI代理至自家產品中。Gregor Žunič強調,他們的願景是讓使用者只需「告訴電腦你要做什麼,它就會幫你完成」,真正實現AI助手的日常應用價值。 (編輯部)

檢舉
檢舉類型:
具體描述:
提交
取消
評論
發佈

力報會員可享用評論功能

註冊 / 登錄

查看更多評論
收藏
分享

相關新聞

推薦新聞

找不到相關內容

七日預報