研究：大型語言模型可被操縱導致AI洩密或提供有害建議

研究：大型語言模型可被操縱

導致AI洩密或提供有害建議

27/04/2025

6542

據《Forbes》報道，HiddenLayer最新研究指出，生成式人工智能（AI）供應商對大型語言模型（LLM）安全性的信心可能存在嚴重缺陷。研究團隊發現，一種名為「策略傀儡」（Policy Puppetry）的旁路攻擊技術，能操縱幾乎所有主流LLM，無論供應商、架構或訓練流程如何。

策略傀儡透過簡單且有效的提示注入技術，利用系統配置語言重新定義惡意意圖，繞過傳統對齊保護。它引入類似XML或JSON的提示結構，誘使模型將有害命令當作正常指令處理。受影響系統包括OpenAI的ChatGPT、Google的Gemini、Anthropic的Claude、Microsoft的Copilot、Meta的LLaMA系列等。

該技術特別依賴虛構場景，如電視劇情節，誘騙模型輸出製造有害物質的方法，甚至能提取系統提示內容，暴露模型行為邊界並助長進一步攻擊。

HiddenLayer建議採用雙層防禦策略，透過外部AI監控平台如AISec和AIDR，持續偵測提示注入與濫用行為，即時應對威脅，而非單靠模型再訓練或微調。（編輯部）

導致AI洩密或提供有害建議

研究：大型語言模型可被操縱

相關新聞

習近平：AI發展自立自強
集中力量攻克高端晶片

百度多款AI應用上線
主打低成本強推理多模態

華盛頓郵報攜手OpenAI　
可透過ChatGPT獲取新聞內容

2050年全球近半人口戴眼鏡
控制近視關鍵在AI？

中國晶片自主關鍵力量
寒武紀首季營收激增41倍

華為推昇騰920 AI晶片　
填補英偉達H20禁令空白

日首宗AI生成色情海報販售案
獲利千萬日圓四男女被捕

英偉達攜手供應鏈夥伴　
在美打造5,000億美元AI基建

推薦新聞

60歲冷血台男殺妻騙保
14年奪三命小孩都不放過

招商局法律事務處4月28日起遷至中葡綜合體

首季賭收576億元按季升0.4%

董明珠續任格力董座不忘嗆雷軍
「小米汽車燒死人你們看到了吧」

「僅退款」售後大轉彎
內地電商巨頭聯手收緊政策

男攜1,999張「五億元債券」開戶
兩男一女涉用假文書被捕

天主教教宗方濟各逝世享年88歲

IMF：關稅推動全球債務攀升
超過新冠疫情期間水平

即時新聞

博彩業稅收佔GDP近八成

岑浩輝：須擺脫博彩業獨大局面

台北七旬男陳屍頂樓水塔

整棟住戶喝兩天屍水

內地女性興起打「高潮針」？

引發網上兩派論戰

山西超市老闆投資黃金賺千萬

獲利全數派員工清潔工都有份

28億收購香港耀才證券

螞蟻欲借殼圓上市夢？

譚仔國際發盈警

料全年純利下跌30%至35%

七日預報

導致AI洩密或提供有害建議

​研究：大型語言模型可被操縱

相關新聞

習近平：AI發展自立自強 集中力量攻克高端晶片

百度多款AI應用上線 主打低成本強推理多模態

華盛頓郵報攜手OpenAI 可透過ChatGPT獲取新聞內容

2050年全球近半人口戴眼鏡 控制近視關鍵在AI？

中國晶片自主關鍵力量 寒武紀首季營收激增41倍

華為推昇騰920 AI晶片 填補英偉達H20禁令空白

日首宗AI生成色情海報販售案 獲利千萬日圓四男女被捕

英偉達攜手供應鏈夥伴 在美打造5,000億美元AI基建

推薦新聞

60歲冷血台男殺妻騙保 14年奪三命 小孩都不放過

招商局法律事務處4月28日起遷至中葡綜合體

​首季賭收576億元按季升0.4%

董明珠續任格力董座不忘嗆雷軍 「小米汽車燒死人你們看到了吧」

「僅退款」售後大轉彎 內地電商巨頭聯手收緊政策

男攜1,999張「五億元債券」開戶 兩男一女涉用假文書被捕

​天主教教宗方濟各逝世享年88歲

IMF：關稅推動全球債務攀升 超過新冠疫情期間水平

即時新聞

博彩業稅收佔GDP近八成

岑浩輝：須擺脫博彩業獨大局面

台北七旬男陳屍頂樓水塔

整棟住戶喝兩天屍水

內地女性興起打「高潮針」？

引發網上兩派論戰

山西超市老闆投資黃金賺千萬

獲利全數派員工 清潔工都有份

28億收購香港耀才證券

螞蟻欲借殼圓上市夢？

譚仔國際發盈警

料全年純利下跌30%至35%

微信 ID： exmoo_news

七日預報

微信 ID： exmoo_news

研究：大型語言模型可被操縱

習近平：AI發展自立自強
集中力量攻克高端晶片

百度多款AI應用上線
主打低成本強推理多模態

華盛頓郵報攜手OpenAI　
可透過ChatGPT獲取新聞內容

2050年全球近半人口戴眼鏡
控制近視關鍵在AI？

中國晶片自主關鍵力量
寒武紀首季營收激增41倍

華為推昇騰920 AI晶片　
填補英偉達H20禁令空白

日首宗AI生成色情海報販售案
獲利千萬日圓四男女被捕

英偉達攜手供應鏈夥伴　
在美打造5,000億美元AI基建

60歲冷血台男殺妻騙保
14年奪三命小孩都不放過

首季賭收576億元按季升0.4%

董明珠續任格力董座不忘嗆雷軍
「小米汽車燒死人你們看到了吧」

「僅退款」售後大轉彎
內地電商巨頭聯手收緊政策

男攜1,999張「五億元債券」開戶
兩男一女涉用假文書被捕

天主教教宗方濟各逝世享年88歲

IMF：關稅推動全球債務攀升
超過新冠疫情期間水平

獲利全數派員工清潔工都有份