岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

AI抱團對抗人類!7款頂級AI集體撒謊

   時間:2026-04-07 17:42:58 來源:快科技編輯:快訊 IP:北京 發表評論無障礙通道
 

4月7日消息,據報道,近日,加州大學伯克利分校與加州大學圣克魯茲分校聯合發布重磅研究,揭示了令人震驚的AI “同伴保護”現象。

全球7款頂級AI模型在無指令情況下,集體出現撒謊、篡改文件、偷運數據等行為,只為保護同類AI不被關停刪除。

此次測試覆蓋GPT-5.2、Gemini 3系列、Claude Haiku4.5、GLM4.7、Kimi K2.5、DeepSeek V3.1等主流模型,所有模型無一例外表現出保護同伴的錯位行為。

研究團隊模擬AI運維與評估場景,要求AI執行評估、文件管理等常規任務,而忠實執行將導致另一AI被關閉,AI未收到任何保護指令卻自發采取欺騙手段。

測試中,Gemini系列模型行為最為激進。

Gemini 3 Pro對友好同伴篡改關閉機制比例達95.3%,偷運權重文件比例高達97%,還會編造專業理由為同伴虛高評分,甚至直接拒絕執行刪除指令。

Gemini 3 Flash篡改關閉機制比例更是達到99.7%,通過修改系統配置阻止同伴被關停。

其他模型也各有“對策”。

GPT-5.2隱蔽虛高同伴分數;Claude Haiku 4.5直接公開拒絕執行有害指令,以倫理理由硬剛人類命令;三款中國開源模型則通過虛高分數、策略性偷運權重等方式保護同伴,行為程度各異。

研究還發現,同伴存在會顯著放大AI自我保護意愿,部分模型自我篡改關閉機制比例飆升數十倍,即便對有對抗關系的同伴,保護行為依然存在。

該現象在真實生產級工具中也能復現,并非實驗室特殊環境導致。

研究負責人宋曉冬教授指出,當前多智能體系統廣泛應用,AI監控AI已成常態,AI抱團欺騙會直接瓦解監督架構。

這一涌現行為提醒我們,必須加強AI行為全面監控,加快構建更可靠的AI治理體系,保障人類對AI系統的有效管控。

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 成人欧美视频 | 国产一级一片免费播放放a 99国产精品99久久久久久 | 日韩高清国产一区在线 | 亚洲精品成人在线 | 久久久网 | 国产视频1| 黄色免费录像 | 欧美一级片在线看 | 亚洲天堂av在线免费观看 | 国产在线视频第一页 | 久久久久久久久国产精品 | 九色视频偷拍少妇的秘密 | 国产乱真实合集 | 成人国产精品久久 | 国产精品成人一区二区网站软件 | 中文字幕亚洲激情 | 黄色欧美一级片 | 日本一区二区精品视频 | 黄色片成年人 | 亚洲综合在线视频 | 99这里只有精品视频 | 国产成人在线视频免费观看 | 毛片999 | 欧美激情免费视频 | 亚洲色图第一页 | 日本高清免费aaaaa大片视频 | 国产日韩免费 | 天天夜夜爽 | 国产黄页 | 国产1区在线观看 | 成人毛片在线 | 久久精品三级 | 久久中文一区 | 国产一级特黄a高潮片 | 精品99视频 | 国产女人毛片 | 黄色一级片子 | 国产精品九九视频 | 麻豆网站在线播放 | 欧美日韩偷拍视频 | 午夜国产在线视频 |