據英國廣播公司(BBC)針對目前市面上四大人工智能(AI)聊天機器人進行的實驗,發現AI並無法精準總結新聞報導,存在著「嚴重錯誤」與扭曲。
報導指出,BBC向新創公司OpenAI的ChatGPT、微軟的Copilot、Google的Grmini及Perplexity AI ,分別提供100則BBC的報導並詢問相關問題,而最終答案存在著「嚴重錯誤」與扭曲。
針對AI的答案,BBC邀請相關領域專家進行評分,結果顯示51%的答案被認定存在重大問題,19%的AI答案出現事實錯誤,包括不正確的事實描述、錯誤的數字與日期。
不準確的答案則包括:Gemin錯誤地聲稱英國國民保健署不建議使用電子菸作為戒菸輔助工具;Perplexity錯誤地引用BBC關於中東的報導,形容伊朗「克制」而以色列的行動為「侵略」。
報道還稱,相較於ChatGPT與Perplexity,Copilot與Gemini出現更多明顯問題。此外,除了不準確的事實,聊天機器人難以分辨個人意見與事實,無法提供必要的背景資訊。
一般而言,BBC會鎖住內容不讓AI聊天機器人使用,但2024年12月間,BBC開放其網頁供測驗使用。
BBC指出,AI總結新聞存在重大錯誤與扭曲。(網絡圖片)