滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

?不卷性能卷“人品”：xAI 發布 Grok 4.20，幻覺率創行業新低

時間：2026-03-13 18:28:06 來源：CHINAZ編輯：快訊 IP：北京 發表評論無障礙通道

在 AI 巨頭們瘋狂堆料、追逐跑分巔峰的當下，馬斯克旗下的 xAI 卻另辟蹊徑，試圖解決 AI 領域最令人頭疼的“一本正經胡說八道”問題。今日，xAI 正式發布了 Grok4.20Beta。盡管在絕對智力跑分上它仍與頂級梯隊保持距離，但在“誠實度”這一關鍵指標上，它卻刷新了行業紀錄。

根據 Artificial Analysis 的最新評測，Grok4.20在推理模式下的智力指數分數為48，雖然落后于和（兩者均為57），但其在事實可靠性上的表現極其驚人:

最低幻覺率:在 AA Omniscience 測試中，Grok4.20達到了 78% 的“非幻覺率”，創下歷史新高。

知之為知之:該模型在面對無法回答的問題時，不再傾向于編造虛假事實，而是能更準確地承認“我不知道”。這種“誠實”對于嚴謹的辦公和研究場景至關重要。

技術架構:三位一體的 API 矩陣

為了滿足不同層級的需求，xAI 此次推出了三種 API 變體:

推理模式（Reasoning）:犧牲速度換取深度邏輯思考，是此次打破幻覺記錄的核心。

標準模式（Non-reasoning）:側重于快速響應與常規交互。

多智能體模式（Multi-agent）:支持多個 AI 實例協同處理復雜任務。

市場策略:加量不加價

除了性能上的獨特性，Grok4.20在商業邏輯上也極具攻擊性:

海量上下文:支持高達 200萬 token 的上下文窗口，能夠一次性吞下整本書或海量代碼庫。

價格優勢:其定價定在每百萬 token2至6美元之間，不僅比前代 Grok4更便宜，在目前的西方主流模型中也極具競爭力。

Grok4.20的發布反映出 xAI 戰略的轉變——不再執著于在通往 AGI 的總分跑道上死磕，而是精準切入“企業級可靠性”這一痛點。正如測評機構所言，如果說其他模型是在努力成為“全知全能的先知”，那么 Grok4.20則在努力成為一個“絕不撒謊的助手”。

對于那些對數據準確性有極高要求的用戶來說，Grok4.20或將成為除 OpenAI 和谷歌之外的第三個重量級選項。

更多>同類資訊

?技術優化仍需打磨:Meta 宣布 Llama4發布計劃推遲至5月

03-13

?百度搜索 Skill 登頂 ClawHub：下載量突破 3.6 萬次，位居全球第一

03-13

雷軍官宣：新一代小米SU7本月即將正式發布

03-13

雷軍公布新一代SU7全新配色：靛石綠

03-13

雷軍：新一代小米SU7肯定會漲價

03-13

一年少賣321億，理想汽車高臺跳水

03-13

亞馬遜獲初步勝利：法院就Perplexity瀏覽器AI代理購物發布臨時禁令

03-13

Meta推遲AI新模型Avocado發布

03-13

百度旗下AI硬件助手「小度」宣布接入OpenClaw生態

03-13

馬斯克道歉：過去數年xAI拒絕了大量有才華求職者，將重新審視簡歷

03-13

京東京喜自營店買「奧克斯」收到「奧克斯同款」，要求退貨費用卻要自己承擔

03-13

京東家電家居「送裝一升級」：AI輔助，服務品類新增150個

03-13

谷歌為地圖應用加入Gemini AI，Ask Maps聊天功能上線

03-13

小米2026年下半年將在印度擴張大家電業務推定制產品并推進合規認證

03-13

雷軍官宣：新一代小米SU7本月登場，續航升級、配置拉滿，交付在即！

03-13

點擊查看更多 +

全站最新

風電板塊爆了！中東戰火，點燃歐洲能源焦慮

ETF風向標 | 能源化工ETF建信本周漲11.27%領跑，電網設備ETF年內強勢“吸金”超260億

圖解丨全球自然資源估值TOP10國家

龍虎榜丨大金重工兩連板創新高，六機構凈買入4.58億元，深股通凈賣出2.41億元

渠道紓壓減負，大珍蓄勢待發！華創證券維持珍酒李渡"強推"評級

港股收評：三大指數再跌！恒指跌近1%，黃金、軍工股下挫

熱門內容

本欄最新

AWE2026現場直擊：小度全系產品登場，解鎖多模態AI生活新體驗

大疆DJI Avata 360全景無人機定檔3月26日，8K影像與飛行體驗再升級

小米新一代SU7靛石綠配色驚艷亮相，9款車色齊聚，智能升級引期待

新一代小米SU7滿負荷生產發運，3月產能沖刺1.6萬輛加速交付

小米新一代SU7靛石綠配色驚艷亮相，9款車色集齊，智能配置升級引期待

10萬級德系家轎優選！全新速騰L安全省油空間大家庭出行理想之選

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

?不卷性能卷“人品”：xAI 發布 Grok 4.20，幻覺率創行業新低

?不卷性能卷“人品”：xAI 發布 Grok 4.20，幻覺率創行業新低