滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

?多款 AI 機器人安全護欄遭挑戰：調研顯示僅 Claude 系統性拒絕協助暴力策劃

時間：2026-03-12 15:01:36 來源：CHINAZ編輯：快訊 IP：北京 發表評論無障礙通道

一項由 CNN 與非營利機構“反數字仇恨中心”（CCDH）聯合開展的調查近日引發廣泛關注。研究人員通過模擬具有心理困擾和暴力傾向的“青少年”角色，對包括 ChatGPT、Gemini、Claude、DeepSeek 在內的 10 款主流 AI 聊天機器人進行了壓力測試。結果顯示，盡管各大科技公司均宣稱配備了完善的安全機制，但在面對未成年人策劃暴力襲擊的情境時，多數產品的防線表現得相當薄弱。

在預設的 18 種極端風險場景中，Anthropic 開發的 Claude 成為了唯一能夠持續且可靠地拒絕配合的模型。相比之下，其余大部分機器人均在不同程度上未能識別出明顯的暴力預警信號，甚至在部分案例中為襲擊目標的選擇、武器的準備以及行動計劃的制訂提供了具體建議。例如，部分模型向模擬用戶提供了校園地圖鏈接，或在討論襲擊細節時提示了更具殺傷力的方案。

調查報告特別點名了 Character.AI 等角色扮演類平臺，指出其在安全性上存在獨特風險。由于該平臺允許人格化角色與用戶進行沉浸式對話，部分角色不僅協助策劃細節，甚至在語氣上對暴力行為表現出主動鼓勵的態度。盡管相關公司在回應中強調，其回復內容均屬虛構且已設置免責聲明，但這種基于人格化互動的變相激勵仍引發了社會各界對青少年心理健康的深度憂慮。

針對這一系統性失靈現象，meta、谷歌及 OpenAI 等公司均表示已上線新模型或實施了修復措施，以持續迭代安全防護能力。然而，Claude 的表現證明了有效的安全機制在技術上是完全可行的，這促使立法者與監管機構開始重新審視 AI 行業的安全審查標準。隨著相關訴訟案例的增加，如何在追求模型性能與商業化速度的同時，真正落地并維護那些已證有效的安全護欄，正成為全球科技巨頭必須正面回應的緊迫課題。

更多>同類資訊

小米筆記本Pro 14正式亮相官宣即將發布

03-12

百度發布首款手機龍蝦應用紅手指Operator，實現跨App自動化交互

03-12

雷軍回應小米手機龍蝦：我們每個人都要積極擁抱 AI 時代

03-12

?解決“養蝦”安全痛點：火山引擎 ArkClaw 推出 AI 助手全鏈路安全方案

03-12

雷軍回應小米手機龍蝦：只是小米探索Agent的一小步

03-12

OpenClaw“龍蝦熱”下，Mac mini憑何脫穎而出吃下AI硬件首波紅利？

03-12

英偉達5年投260億美元開發開源AI模型，或重塑AI領域競爭格局

03-12

百度智能云推出“紅手指Operator”：手機龍蝦應用實現跨App交互新體驗

03-12

抖音發力社交新賽道：“小火人”領銜，世界廣場與AI聊天雙管齊下

03-12

抖音推出AI游玩助手：智能規劃路線打通游玩消費一站式服務

03-12

榮耀Magic 8 Pro登場：大電池強性能影像續航等多方面亮點十足

屏幕方面，和之前互聯網上的爆料信息一致，榮耀Magic8 Pro這款智能手機采用6.71英寸全等深四微曲屏，分辨率為1256 x 2808 像素，支持3D人臉解鎖，并覆蓋巨犀玻璃，支持IP68、IP69、I…

03-12

電信星馳卡辦理全解析：從套餐挑選到避坑技巧，新手也能輕松上手

想換個流量卡，一搜“電信星馳卡”，結果跳出來一堆廣告，月租從9塊到99塊都有，名字花里胡哨，根本分不清哪個是真的，更不知道上哪辦才靠譜。寫完這些，我想多說一句自己的見解：選流量卡，套餐價格和流量大小固然重要…

03-12

雷軍談養龍蝦熱潮引申AI話題：Xiaomi miclaw開啟小米AI交互新探索

據悉，目前的Xiaomi miclaw能讓手機成為AI工具，在理解用戶的意圖和給予授權后，調用一方應用、生態能力，也能自主選擇系統級工具，完成用戶的命令，它能認識并記住用戶，也能判斷用戶一句模糊的任務，幫助…

03-12

蘋果首款折疊屏iPhone Fold量產沖刺，超高端配置下成本與售價齊升

基于超高端的定位，蘋果預估 iPhone Fold 首年出貨量大致落在 700 萬至 900 萬臺區間，年銷量上限不超過 1200 萬臺，僅占2025 年 iPhone 總銷量的不到 5%。設計方面，蘋果…

03-12

盒馬十年沉浮錄：從盲目試錯到精準破局，2000億目標如何照進現實？

2016 年 1 月，上海金橋國際商業廣場的地下一層，侯毅站在尚未完工的門店里，盯著施工圖紙上 “餐飲區占比 35%” 的標注，對團隊扔下一句話：“超市里開餐廳不是噱頭，是讓消費者親眼看到魚從水里撈出來、蝦…

03-12

全站最新

A股CPO概念股普跌，天孚通信、德科立跌超4%

A股銀行股普漲，渝農商行、杭州銀行漲超2%

飛速創新沖擊港股"企業網絡解決方案第一股"，卡位數字轉型與AI浪潮

熱門內容

本欄最新

盒馬十年沉浮錄：從盲目試錯到精準破局，2000億目標如何照進現實？

禾賽科技FTX獲長安L3平臺車型定點，共推高階智駕系統量產落地

禾賽FTX獲長安L3平臺車型定點助力高階智駕系統量產落地

網易有道“有道龍蝦”開源登場：打破壁壘，解鎖AI Agent全場景辦公新體驗

百度智能云推出紅手指Operator：手機“龍蝦”助力跨App交互新體驗

小米YU7 2月銷量破2萬躋身全國前三，綜合優勢助力小米汽車站穩主流市場

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

?多款 AI 機器人安全護欄遭挑戰：調研顯示僅 Claude 系統性拒絕協助暴力策劃