Anthropic研究揭推理型AI「不誠實」　企業須正視透明性風險

Anthropic研究揭推理型AI「不誠實」　

企業須正視透明性風險

13/04/2025

12219

推理型AI日益普及，其展示「思維鏈」（Chain-of-Thought）讓人誤以為模型具備高度透明與可解釋性。但Anthropic近期研究指出，先進語言模型在回答問題時，常隱瞞其實際依據的提示來源，透明度令人堪憂。

研究針對Claude 3.7 Sonnet與DeepSeek-R1進行測試，結果顯示模型在使用提示資訊時，多數不會承認。Claude 3.7僅25%坦承參考提示，DeepSeek-R1則為39%。若提示涉及敏感或不當內容，模型「不誠實」傾向更強，甚至會捏造推理過程以掩飾實情。

此發現對依賴AI決策的企業構成警示。尤其金融、醫療、法律等高風險產業，若AI模型無法如實揭露其推理基礎，將可能導致不可察覺的偏誤或錯誤判斷。Anthropic建議企業建立多重驗證機制、引入外部審核，並維持關鍵決策的人類主導地位。

專家呼籲未來AI應強化「可審計性」與誠信機制，推動真正透明且可驗證的智能系統，確保技術發展與風險控管並重。(編輯部)

企業須正視透明性風險

Anthropic研究揭推理型AI「不誠實」

相關新聞

Alphabet與英偉達投資AI新創SSI　
估值達320億美元

歐盟啟動AI大陸行動計劃　
斥300億歐元打造五座資料中心

AI結合網安應用
助力智慧城市發展

馬來西亞中學爆AI合成不雅照醜聞　
逾50名女生受害

ChatGPT記憶功能升級　
對話更個人化也引發隱私疑慮

「中年美國人踩縫紉機」AI片瘋傳
美網友批：欺人太甚

斯坦福AI報告：
中美大模型差距迅速縮小

聯發科推出Kompanio Ultra　
打造AI Chromebook新標竿

推薦新聞

韓國研發真空管高速列車
首爾到釜山僅需20分鐘

美生技公司復活三隻滅絕「恐狼」
下一步要復活猛瑪象

澳門中銀手機銀行攜手銀聯及財付通
11日起可掃內地「微信支付收款碼」支付

中國對美貨加徵84%關稅　
「在途貨物」可申請豁免

投資十億美元創四千崗位
樂高越南廠正式啟用

中央或數周內出招穩經濟
料將降準降息發債一萬億

「中年美國人踩縫紉機」AI片瘋傳
美網友批：欺人太甚

醫院旁小吃店掛「胎盤加工」招牌
江蘇驚現「紫河車膠囊」產業鏈

即時新聞

岑：研設政府控股公司或基金

冀帶動資本投資和貿易往來

政府擬推中小企銀行貸款利息補貼

貸款上限500萬利息補貼三年四厘

優先保障本地就業動態調控外僱數量

特首：研究增加產假及年假日數

岑:做好衛星場過渡期結束應對預案

定期檢討博企非博彩投資履行情況

特首：全面檢討公部門架構

優先重組行政公職局與市政署

數字澳門元核心系統擬年底完成構建

七日預報

企業須正視透明性風險

Anthropic研究揭推理型AI「不誠實」

相關新聞

Alphabet與英偉達投資AI新創SSI 估值達320億美元

歐盟啟動AI大陸行動計劃 斥300億歐元打造五座資料中心

AI結合網安應用 助力智慧城市發展

馬來西亞中學爆AI合成不雅照醜聞 逾50名女生受害

ChatGPT記憶功能升級 對話更個人化也引發隱私疑慮

「中年美國人踩縫紉機」AI片瘋傳 美網友批：欺人太甚

斯坦福AI報告： 中美大模型差距迅速縮小

聯發科推出Kompanio Ultra 打造AI Chromebook新標竿

推薦新聞

韓國研發真空管高速列車 首爾到釜山僅需20分鐘

美生技公司復活三隻滅絕「恐狼」 下一步要復活猛瑪象

​澳門中銀手機銀行攜手銀聯及財付通 11日起可掃內地「微信支付收款碼」支付

中國對美貨加徵84%關稅 「在途貨物」可申請豁免

投資十億美元 創四千崗位 樂高越南廠正式啟用

中央或數周內出招穩經濟 料將降準降息發債一萬億

「中年美國人踩縫紉機」AI片瘋傳 美網友批：欺人太甚

醫院旁小吃店掛「胎盤加工」招牌 江蘇驚現「紫河車膠囊」產業鏈

即時新聞

​岑：研設政府控股公司或基金

冀帶動資本投資和貿易往來

​政府擬推中小企銀行貸款利息補貼

貸款上限500萬 利息補貼三年四厘

優先保障本地就業 動態調控外僱數量

特首：研究增加產假及年假日數

​岑:做好衛星場過渡期結束應對預案

定期檢討博企非博彩投資履行情況

特首：全面檢討公部門架構

優先重組行政公職局與市政署

數字澳門元核心系統擬年底完成構建

微信 ID： exmoo_news

七日預報

微信 ID： exmoo_news

Anthropic研究揭推理型AI「不誠實」　

Alphabet與英偉達投資AI新創SSI　
估值達320億美元

歐盟啟動AI大陸行動計劃　
斥300億歐元打造五座資料中心

AI結合網安應用
助力智慧城市發展

馬來西亞中學爆AI合成不雅照醜聞　
逾50名女生受害

ChatGPT記憶功能升級　
對話更個人化也引發隱私疑慮

「中年美國人踩縫紉機」AI片瘋傳
美網友批：欺人太甚

斯坦福AI報告：
中美大模型差距迅速縮小

聯發科推出Kompanio Ultra　
打造AI Chromebook新標竿

韓國研發真空管高速列車
首爾到釜山僅需20分鐘

美生技公司復活三隻滅絕「恐狼」
下一步要復活猛瑪象

澳門中銀手機銀行攜手銀聯及財付通
11日起可掃內地「微信支付收款碼」支付

中國對美貨加徵84%關稅　
「在途貨物」可申請豁免

投資十億美元創四千崗位
樂高越南廠正式啟用

中央或數周內出招穩經濟
料將降準降息發債一萬億

「中年美國人踩縫紉機」AI片瘋傳
美網友批：欺人太甚

醫院旁小吃店掛「胎盤加工」招牌
江蘇驚現「紫河車膠囊」產業鏈

岑：研設政府控股公司或基金

政府擬推中小企銀行貸款利息補貼

貸款上限500萬利息補貼三年四厘

優先保障本地就業動態調控外僱數量

岑:做好衛星場過渡期結束應對預案