人工智能代理平台Manus近期迅速爆紅,其背後核心開源工具Browser Use也隨之登上技術舞台,成為開發圈熱門話題。Browser Use 的突破點,在於它讓AI 「讀懂」網站結構,而非單靠視覺模擬,大幅提升任務操作的穩定性與靈活性。這項由兩位碩士生四天完成的原型,短時間內吸引全球開發者關注,更獲得1,700萬美元投資,正式邁向商業化。開源工具Browser Use由兩名蘇黎世聯邦理工學院碩士生開發而成。 (網絡圖片)
開源工具Browser Use不只是爬蟲工具。(網絡圖片)
隨著AI代理(AI Agent)逐漸成為新一代人工智能應用的熱門領域,許多新創團隊積極開發能自主操作網站的AI工具,但多數解法仍仰賴截圖與座標模擬方式進行操作,當網站稍有變動便容易失效。Browser Use 則採取完全不同的策略,不靠視覺模擬,而是將網站互動元素如按鈕、表單等,轉譯為語意化、結構化的文字格式,讓語言模型能像理解自然語言一樣理解網站邏輯。
這項突破讓AI能更精確執行登入、下載報表、填表等操作,並支援分頁切換、模擬滑鼠鍵盤輸入、存取本地檔案等功能,大幅拓展AI代理的應用可能。使用者只需輸入簡單任務指令,即可讓AI如人類般完成整個操作流程,解決了傳統網頁自動化流程易壞、難維護的痛點。
Browser Use共 同 創 辦 人Gregor Žunič指出,這樣的設計讓AI不再只是「模仿人類操作」,而是「理解網頁意圖」後主動行動,真正具備智慧代理的核心能力。該專案的介紹文章在X平台瀏覽量突破240萬,GitHub星標超過五萬顆,成為開源社群焦點。
獲1,700萬美元資金
Browser Use 的雛形,其實只是瑞士蘇黎世聯邦理工學院兩位資料科學碩士生 Magnus Müller 與 Gregor Žunič 在一次午餐聊天中的靈 感。 他 們 在 創 新 加 速 器「 Student Project House 」相識後,花四天時間打造出最小可行產品(MVP),並上傳至 GitHub 與 Hacker News,迅速獲得熱烈迴響。
初期,Browser Use 僅提供開源版本供開發者部署。隨著使用者需求暴增,團隊也順勢推出雲端服務版本,每月訂價30美元,整合IP切換、驗證碼處理、自動登入等功能,讓使用者免除繁瑣設定即可上手。
這波熱潮不僅吸引開發者,也引來資本市場青睞。Browser Use 在種子輪募資中獲得1,700萬 美 元 資 金, 由 創 投Felicis領 投,Paul Graham、Nexus Venture Partners 等 知 名 投資人參 與。Felicis合夥人Astasia Myers表示, Browser Use展現了開源優先與代理型AI應用的潛力,加上團隊執行力強,是投資的重要原因。
團隊未來將進一步開發語音操作、任務排程、自動重試等功能,並推出API介面,幫助開發者更容易整合AI代理至自家產品中。Gregor Žunič強調,他們的願景是讓使用者只需「告訴電腦你要做什麼,它就會幫你完成」,真正實現AI助手的日常應用價值。