岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear科技資訊
手機版
二維碼
內容搜索
無障礙通道
語言：中文 EN

ITBear旗下自媒體矩陣：

滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

OpenAI發布開源評測CoT-Control，用于衡量模型思維鏈可控性

時間：2026-03-06 18:07:27 來源：鞭牛士編輯：快訊 IP：北京 發表評論無障礙通道

AIPress.com.cn報道

隨著AI智能體越來越能自主完成復雜任務，如何有效監督其行為成為關鍵議題。OpenAI最新研究聚焦一種潛在風險：當模型知道自己的推理過程會被監控時，是否可能刻意改寫或遮掩思維鏈，從而讓監控失效、評估結果被高估。

OpenAI表示，思維鏈監控是其多層安全體系的一部分，可通過分析模型推理步驟來識別不安全行為或偏離用戶意圖的跡象。為驗證“思維鏈是否會被刻意操控”，OpenAI提出并開源了評測套件CoT-Control，包含超過1.3萬道任務，來自GPQA、MMLU-Pro、HLE等多個基準，用于測試模型能否在解題時遵守針對思維鏈的限制指令，比如避免特定關鍵詞、只用小寫字母或按要求追加特定詞語。

研究對13個推理模型進行評測后發現，當前前沿模型普遍難以穩定控制自己的思維鏈，可控性得分整體很低，最低約0.1%，最高也未超過15.4%。研究還指出，模型規模更大時可控性略有提升，但當推理更長或經歷更多后訓練時，可控性反而下降。即使告知模型“正在被監控或評測”，可控性也只是小幅上升。

OpenAI認為，這一結果意味著在當前階段，模型還不太具備通過操控思維鏈來逃避監控的能力，因而思維鏈監控短期內仍具參考價值。但公司也強調需持續跟蹤，未來將把思維鏈可控性與可監控性一起納入前沿模型的系統卡披露指標，以便及時發現趨勢變化。

更多>同類資訊

消息稱OpenAI研發新語音模型BiDi

03-06

螞蟻數科AItoB加速出海，螞蟻數科在馬來西亞設立運營中心

03-06

奈飛收購本·阿弗萊克創辦的影視AI技術公司

03-06

Rambus發布HBM4E內存控制器IP，為下一代AI處理器提供超強性能助力

這一新解決方案通過先進的可靠性功能實現了突破性性能，使設計師能夠應對下一代AI加速器和圖形處理器（GPU）對內存帶寬要求極高的需求。“作為AI應用領域的領先硅片IP供應商，我們正在將行業領先的HBM4E控制器…

03-06

構建“熱帶雨林”生態：高校賦能人工智能+創新發展新路徑

高校是創新供給的重要源頭，是提升國家創新體系整體效能的重要節點，是催生發展新質生產力的重要推力。打造“學科兩頭發力”“機制雙管齊下”的陣列式教育科技人才一體化動力引擎，營造 “陽光雨露充沛”“空間充足”的熱…

03-06

GPT-5.4原生操控電腦能力突破：OpenClaw迎來最強“大腦”賦能

Agent 能力是 2026 年 AI 進化的主線任務，在實測后，一個深刻的感受：GPT-5.4 可能是 2026 年目前為止，最適合跑OpenClaw 的模型。這意味著接入 GPT-5.4 的 Open…

03-06

國家發改委定目標：“十五五”末人工智能產業規模邁向超10萬億新臺階

IT之家 3 月 6 日消息，據新華社報道，國家發展改革委主任鄭柵潔 3 月 6 日在十四屆全國人大四次會議經濟主題記者會上說，將深化“人工智能+”行動，“十五五”末人工智能相關產業規模將增長到 10 萬億…

03-06

中國移動MWC展實力：5G-A領航、6G突破，共繪全球數智新藍圖

在2026世界移動通信大會（MWC）上，中國移動以“碳硅共生，合創AI+時代”為主題，系統展示了5G-A、6G、AI大模型及全球算力網絡的最新成果，凸顯中國通信技術在全球數字化轉型中的核心引領作用。應用層面，…

03-06

MWC 2026：中國移動“碳硅共生”引領，共繪AI+時代數智新畫卷

本次大會上，中國移動以“碳硅共生，合創AI+時代”為主題，全方位展示了其在通信、算力、智能服務三大領域的最新突破與全球布局。從5G-A的規模商用到6G的前沿探索，從全球算力網絡的堅實底座到“靈犀”智能體的全域…

03-06

MWC26巴塞羅那：華為八度折桂GLOMO獎彰顯創新實力

（全球TMT2026年3月6日訊）在MWC26巴塞羅那期間，華為斬獲八項重量級GLOMO獎項。華為在全頻段向5G演進過程中，圍繞超寬帶、多天線和綠色節能等領域開展了解決方案的創新，獲“最佳移動網絡基礎設施獎…

03-06

MWC 2026現場直擊：中國移動以創新科技，繪就數智生活新藍圖

縱觀此次中國移動在MWC2026的生動展示，這不僅是一場技術與創新的集中呈現，更是一次對未來場景的深度詮釋——它描繪了一幅以領先通信、泛在算力、強大AI為基石，科技與產業深度融合，智慧服務觸手可及的數智生活…

03-06

中國移動閃耀MWC 2026：以“中國方案”引領全球數智化“中式生活”新潮流

中國移動以“碳硅共生，合創AI+時代”為主題，攜通信服務、算力服務、智能服務三大主業的創新成果與產業解決方案亮相，生動展示了“中國智造”的科技實力與創新實踐的“中國標準”，以全新AI場景下的“中式生活”，彰…

03-06

2025換機潮來襲，天璣9500憑能效優勢成旗艦機“體驗新標桿”

這顆芯片之所以在年底這波換機潮里成了香餑餑，就是因為它把能效這件事琢磨透了。天璣9500這次非常聰明，它沒有去死磕那些只有在跑分軟件里才能看到的極限數字，而是把功夫花在了大家每天都能感知到的體驗上：更穩的幀…

03-06

GPT-5.4來襲：原生操控電腦能力升級，多維度突破重塑AI工作助手新體驗

GPT-5.4 在 API 和 Codex 中支持最高 100 萬 token（標記）的上下文窗口（ContextWindow，即模型單次處理文本的長度上限），這是目前 OpenAI 提供的最大上下文窗口…

03-06

華為MWC26大放異彩：八項GLOMO獎項彰顯移動通信領域卓越實力

03-06

點擊查看更多 +

全站最新

嵐圖泰山將全球首搭華為896線激光雷達下線即交付且已獲L3道路測試牌照

恒科指大反攻！科技主線殺回，估值修復行情啟動？

同程旅行版"女子圖鑒"：從全家旅行"主理人"到"勇闖世界"奶奶團

恒生科技ETF漲超3%，年內超446億元資金凈流入恒生科技ETF

龍虎榜丨合力泰跌8.16%，溫州幫凈賣出2.57億元

龍虎榜丨大金重工跌7.39%，深股通凈賣出1.09億元，五機構凈賣出1.8億元

熱門內容

本欄最新

宋Ultra EV預售開啟：二代刀片電池加持，15.5萬起重塑B級純電SUV格局

零代碼也能輕松建站？AI工具讓網站搭建從技術活變簡單操作

黃仁勛“最后一投”背后：AI投資邏輯生變，行業邁向務實新階段

MWC2026現場：中興發布全球首款AI+Wi-Fi 8 CPE，移動互聯終端戰略再升級

廣汽豐田鉑智7來襲！3月5日預售，鴻蒙座艙5助力合資純電智能化突圍

魯大師2月電動兩輪車榜單揭曉：九號小牛領跑，智能化成競爭新焦點

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.