OpenAI近日推出具備視覺推理能力的最新模型o3與o4-mini,引發網路熱潮。許多用戶開始運用ChatGPT上傳街景、菜單、建築照等圖片,要求模型像在玩GeoGuessr遊戲般推理圖像位置。這類「看圖辨位」功能在X平台快速擴散,甚至能精準指出城市、地標、餐廳或酒吧的位置。
OpenAI表示,這些模型具備「以圖像思考」的能力,可透過多步驟推理協助使用者解決問題。不過,雖未利用對話記憶或EXIF資料,o3卻能單靠畫面線索推測圖中位置,引發對隱私外洩的疑慮。外界擔心不肖人士可能利用此功能追蹤他人行蹤,甚至破解社群平台上的限時動態。
根據TechCrunch測試,雖然舊款GPT 4o在某些案例中推理更快、答對率也不低,但o3具備更強的推理過程與整體判斷力。這突顯AI視覺能力日益強大之際,隱私風險也同步升高。
OpenAI強調已設下防線,訓練模型拒絕處理私人資訊,並持續監控濫用行為,防範隱私遭侵害。(編輯部)