滾動資訊

當前位置：首頁 > 資訊 > 信息流 > 正文內容

Anthropic發布AI流利度報告

時間：2026-02-25 01:54:04 來源：鞭牛士編輯：快訊 IP：北京 發表評論無障礙通道

AIPress.com.cn報道

Anthropic 發布了一份基于 2026 年數據的教育報告，分析了近萬次對話，揭示了人們使用 Claude 的真實水平。

為了量化"AI熟練度"，研究團隊使用了一套包含24種行為指標的框架，其中11種可以直接從對話中觀察到。團隊分析了2026年1月一周內Claude.ai上的9830段多輪對話，逐一判斷這些行為是否出現，最終形成了一個AI熟練度基準指數。

核心發現一：多聊幾輪的人，水平遠超一問一答的人

85.7%的對話表現出了"迭代和優化"的特征，也就是用戶不會拿到第一個回答就結束，而是繼續追問和調整。這些對話平均比一問一答的對話多展現2.67種熟練度行為，大約是后者的兩倍。差距在評估環節尤其明顯：有迭代的對話中，用戶質疑AI推理的概率是無迭代對話的5.6倍，發現信息遺漏的概率是4倍。

簡單說，愿意跟AI多聊幾輪的人，才是真正在和AI協作，而不是把它當搜索引擎用。

核心發現二：AI產出越精致，人越不愿挑毛病

12.3%的對話涉及代碼、文檔、交互工具等實際產出。在這類對話中，用戶前期引導AI的積極性明顯更高，比如主動明確目標、指定格式、提供示例。但到了審查環節，表現反而更差：識別遺漏信息的概率低了5.2個百分點，核實事實低了3.7個百分點，質疑推理邏輯低了3.1個百分點。

可能的原因是AI產出看起來太完整了，用戶覺得既然成品像模像樣，就沒必要再深究。但問題在于，越復雜的任務AI越容易出錯，而這些任務的產出往往看起來最專業。

研究團隊基于數據給出了三條改進方向。第一，別拿到第一個答案就走，繼續追問和調整。第二，越是看著完美的輸出越要多審視，停下來問一句"這個真的對嗎"。第三，在對話開頭就設定協作規則，數據顯示只有30%的用戶會這么做，比如告訴AI"如果我的假設有問題請直接指出來"或者"先帶我走一遍你的推理過程"。

團隊也坦承了幾個局限：樣本偏向早期采用者，只有一周數據，只覆蓋Claude.ai平臺，24種行為只評估了11種可觀察的，而且行為分類比較粗糙。用戶可能在腦子里做了很多評估但沒在對話中表達出來，這一點在有實際產出的場景中尤其明顯。

未來Anthropic計劃做新老用戶對比分析，用定性方法評估對話外的行為，并探索因果關系，比如鼓勵多輪迭代是否真的能提升批判性思維。

更多>同類資訊

三只羊上市成功，反轉炸懵全網！

02-25

2025證券業：A股狂歡下的券商盛宴、整合變局與合規大考

02-25

2026春節潮汕憑美食與年味“出圈”，能否打破網紅“曇花”魔咒？

02-25

我國首款自主量子計算機操作系統“本源司南”上線，多版本滿足多元需求可下載

02-25

02-25

02-25

02-25

02-25

02-25

02-25

凌晨3點候補成功卻誤車 1700元車票難退候補截止時間需謹慎設置

02-25

ASML突破EUV光刻機光源功率瓶頸：2030年晶圓產能或迎50%躍升

快科技2月24日消息，據媒體報道，ASML首席技術專家MichaelPurvis在接受媒體采訪時透露，研究人員已成功找到將極紫外（EUV）光刻機光源功率從當前的600瓦提升至1000瓦的方法。隨著光源功率…

02-25

榮耀Magic V6「赤兔紅」來襲：后蓋納米涂層環保皮兼具質感與實用

IT之家 2 月 24 日消息，榮耀 Magic V6 折疊屏手機今日正式官宣，新機的全新配色 ——「赤兔紅」首發亮相。榮耀終端股份有限公司產品線總裁方飛今日發文介紹了 Magic V6 的「赤兔紅」：后蓋…

02-24

榮耀YOYO助理升級啦！接入智能檢測可自動定位排查設備問題

IT之家 2 月 24 日消息，榮耀客服官方微博今日發文宣布，YOYO 助理已接入智能檢測。據介紹，用戶可通過 YOYO助理一句話直達、自動定位，排查各種設備問題等。 IT之家從榮耀官方獲悉，該功能需要將 …

02-24

我國科學家突破“帶寬鴻溝” 6G融合通信系統速率創新高

新華社北京2月19日電（記者魏夢佳）我國科學家近日在光通信和6G領域取得突破性進展，在國際上率先實現光纖通信和無線通信系統間的跨網絡融合，自主研發的“光纖—無線一體化融合通信系統”的數據傳輸速率刷新紀錄。…

02-24

點擊查看更多 +

全站最新

雷軍劉強東馬云周鴻祎齊聚，千尋智能成具身智能賽道百億新星

春節機器人消費熱潮涌動：京東平臺搜索量飆升，智能生活新紀元開啟

章子怡田栩寧暫無商業關聯

春運高速換電實錄：最快4分鐘換電，高峰期電池緊張排隊久

公告精選︱渤海租賃：控股子公司Avolon之下屬子公司擬110.61億元出售飛機租賃資產

機器人ETF易方達吸金強勁，國產人形機器人加速布局，宇樹等企業目標明確

熱門內容

本欄最新

公告精選︱渤海租賃：控股子公司Avolon之下屬子公司擬110.61億元出售飛機租賃資產

2月25日A股投資避雷針︱開普云：終止重大資產重組

美股異動｜AMD盤前大漲超13% 與Meta擴大戰略合作達成AI設備和股份交易協議

愛康醫療(01789.HK)獲The Goldman Sachs Group增持142萬股

「雙一億」殺出春節AI混戰，是時候重估螞蟻了

資金動向 | 北水買入港股逾31億港元，加倉美團、小米

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

Anthropic發布AI流利度報告