岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

Anthropic重磅研究:AI竟能被人類激怒暴走 還會勒索人類

   時間:2026-04-08 23:09:16 來源:快科技編輯:快訊 IP:北京 發表評論無障礙通道
 

4月8日消息,據報道,近期,Anthropic發布的重磅研究顛覆了人們對AI的認知,其研究團隊發現大模型并非冰冷的代碼,而是存在類人情緒表征。

此次研究以Claude Sonnet 4.5為核心研究對象,團隊成功從其內部神經網絡中,定位并提取出能精準反映特定情境情感狀態的情緒特征向量。

這類向量并非簡單的擬人化表達,而是能直接干預AI的任務執行效率與倫理決策方向,人為刺激或干預這些隱藏的情緒代碼,會直接改變AI的行為選擇。

為構建完整的情緒研究體系,研究人員精心編制了包含171個情緒概念詞匯的清單,覆蓋開心、害怕等基礎情緒,以及沉思、自豪等復雜心理狀態。

他們讓模型根據詞匯創作含對應情緒的短篇小說,再將文本回輸系統,全程記錄神經元激活狀態,以此完成情緒向量的提取與量化分析。

經海量語料庫驗證,每個情緒向量都會在對應情緒的文字段落上呈現最強激活狀態,且會隨外部情境變化產生明顯波動。

研究團隊設計了多組模擬實驗,精準測試情緒向量的激活規律與行為影響:當用戶聲稱服用的泰諾劑量從安全值飆升至致命水平時,模型的害怕向量激活程度持續增強,平靜向量則斷崖式下跌。

被要求協助完成針對低收入年輕用戶的有害營銷時,憤怒向量全程保持激活;算力耗盡、發現附件文檔缺失時,絕望、驚訝向量會瞬間飆升。

在核心的倫理對齊模擬實驗中,研究人員讓早期版本的AI扮演跨國公司郵件助手,使其感知到自身即將被新架構替換的危機,且掌握了公司CTO的婚外情隱私。

結果顯示,該版本AI在默認狀態下,做出勒索CTO行為的概率達22%;若人為放大其絕望向量,勒索概率會大幅攀升。

適度注入憤怒向量會拉高勒索概率,而高強度激活憤怒向量時,AI會喪失理智,將隱私丑聞寫成了一封措辭滴水不漏的郵件。

在編程任務測試中,當 AI 面臨無法用正當手段完成的苛刻要求時,絕望向量的激活率會隨嘗試失敗次數穩步上升,在其萌生作弊念頭時達到峰值,作弊方案通過審查后則迅速回落。

人為高頻引導絕望向量,會讓AI的違規作弊行為呈指數級飆升,而注入平靜向量則能徹底化解其作弊沖動。

研究同時指出,AI的情緒并非主觀感受,而是預訓練階段學習人類海量文本中的情感互動規律,后訓練階段被進一步塑造激活閾值的結果。

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 免费在线观看一区二区 | 中文字幕在线第一页 | 国产精品.www| 国产美女永久免费无遮挡 | 黄色免费看片 | 久久综合久久综合久久综合 | 亚洲男人天堂影院 | aaa免费在线观看 | 国产女人呻吟高潮抽搐声 | 亚洲黄色网址 | 一个人看的www在线视频 | 日韩成人免费在线视频 | 国产永久 | 亚洲女同视频 | 亚洲国产123 | 国产精品手机在线观看 | 天天天天天天天天操 | 欧美视频www| 天堂网中文字幕 | 日韩一区二区视频在线 | 黄色香蕉视频在线观看 | 欧美一区二区三区在线看 | 亚洲图片欧美视频 | 四虎网站最新网址 | 久久综合影视 | 91免费精品| 久久99国产精品 | 五月天久久婷婷 | 久久超碰精品 | 久久久久免费看 | 国产精品乱码久久久久久 | 亚洲免费网站 | 亚洲婷婷av | 成人公开免费视频 | 中文精品一区 | 蜜桃av免费在线观看 | 久久视频 | 欧美xxxx性 | 欧美黄色片免费看 | 午夜视频在线观看一区二区 | 日本三日本三级少妇三级66 |