滾動資訊

當前位置：首頁 > 資訊 > 業(yè)界動態(tài) > 正文內容

GPT-5.3新模型撞車Gemini

時間：2026-03-04 11:45:17 來源：APPSO編輯：快訊 IP：北京 發(fā)表評論無障礙通道

在 AI 模型的命名玄學里，「Instant」和「Lite」這兩個后綴，長期以來都帶著一股說不清道不明的廉價感。

不是沒有原因。過去這類模型給人留下的印象，基本就是：速度快、腦子慢，做做文本總結勉強夠用，一旦碰上稍微復雜的推理任務，就開始一本正經(jīng)地胡說八道。

久而久之，輕量模型幾乎成了「將就用」的代名詞。

就在剛剛，OpenAI 和 Google 又一次撞車，發(fā)布了各自的輕量模型，并試圖用硬實力來扭轉這個刻板印象。省流版如下：

GPT-5.3 Instant：更具「人味兒」的智能助理，大幅降低幻覺率、減少「AI 腔」以及強化細節(jié)寫作能力，溝通更自然精準，適合對內容質量要求高的場景（寫作、專業(yè)問答、高風險領域）

Gemini 3.1 Flash-Lite：便宜、快、不拖泥帶水，還支持「思考等級」調節(jié)功能，在保持高吞吐量的基礎上兼顧了深層邏輯推理，適合大規(guī)模、高實時性的批量任務（內容審核、UI 生成、NPC 對話）

GPT-5.3 Instant：終于學會像個正常人一樣聊天了

經(jīng)常用 ChatGPT 的人，大概都有過這種無奈：你只是隨口問個小問題，它非要先給你端上一段「作為一個人工智能，我需要提醒你……」的長篇大論。

這種總想教人做事的「AI 腔」，確實挺招人煩的。好在，OpenAI 這次是真的聽進去了。

新上線的 GPT-5.3 Instant 花了很大的力氣來解決這個「毛病」。它學會了直接給出答案，不再啰里啰嗦地鋪墊。

除了不愛說廢話，它也變得更靠譜了。舊版本搜完網(wǎng)頁之后，容易把一堆鏈接和不相關信息堆到你面前。

得益于搜索能力的提升，GPT-5.3 Instant 會主動把網(wǎng)頁內容和自身的背景知識結合起來，先想清楚你真正想問什么，再給出有重點的回答，而不是把搜索引擎的工作原封不動地轉包給你。

OpenAI 公布的內部評測顯示，在聯(lián)網(wǎng)狀態(tài)下幻覺率降低了 26.8%，僅靠內部知識時也降低了 19.7%。官方特別提到醫(yī)療、法律、金融等高風險領域，新模型在這些場景下的謹慎程度和準確性都有明顯改善。

最令人驚喜的，其實是它在寫作上的變化。

OpenAI 用一首詩的對比做了說明：同樣寫一個費城郵遞員退休最后一天，舊版本傾向于堆砌「把這座城市背在郵袋里」這類抒情句，新版本則會寫那根「掉漆的藍色欄桿」、那扇「總有狗在門口等著的柵門」。情緒不靠凹，就這樣自然而然流露出來。

語氣上的調整也是此次更新的核心目標之一。

「停下。深呼吸。」這類會打斷對話節(jié)奏的句式被刻意減少，整體風格更直接，少了一種不必要的「AI 腔」。用戶仍可在設置里自定義回復的溫暖程度與熱情度，調出自己習慣的交互風格。

GPT-5.3 Instant 即日起向所有 ChatGPT 用戶開放，API 名稱為「gpt-5.3-chat-latest」。付費用戶還可以在舊版模型里繼續(xù)用 GPT-5.2 Instant，但它將在今年 6 月 3 日正式退役。

彩蛋時間

Gemini 3.1 Flash-Lite：便宜、反應快，還挺聰明

相比于 GPT-5.3 Instant 的好好說話，Gemini 3.1 Flash-Lite 走的是純粹的務實風，目標非常明確：就是要快，就是要便宜。

價格方面，Gemini 3.1 Flash-Lite 的輸入價格是 0.25 美元每百萬 tokens，輸出價格是 1.50 美元每百萬 tokens。

這是什么概念？如果你是一個開發(fā)者，這意味著你大概花不到 2 塊錢人民幣，就能讓 AI 閱讀相當于 5 本《哈利·波特》全集的文字量。

覺得便宜沒好貨？格局小了。

根據(jù) Artificial Analysis 的基準測試，，相比上一代的 Gemini 2.5 Flash，3.1 Flash-Lite 的首字響應時間（TTFT）快了 2.5 倍，整體輸出速度提升了 45%。對于需要實時響應的產品來說，這個延遲差距在用戶體驗上會有肉眼可見的感受。

這意味著，當你還在眨眼的時候，它的回答可能已經(jīng)生成了一半。對于那些需要實時反饋的應用——比如即時翻譯、游戲內的 NPC 對話、即時 UI 生成——這種低延遲是決定性的。

除此之外，Gemini 3.1 Flash-Lite 還具備「思考」能力。

在 AI Studio 和 Vertex AI 中，Google 為這款 Lite 模型配備了「思考等級（Thinking Levels）」的選項。開發(fā)者可以根據(jù)任務的復雜程度，自主調節(jié)模型「想多深」。

簡單的高吞吐量任務，比如批量內容翻譯和內容審核，可以用最輕的配置快速跑完；遇到需要嚴格遵循指令的界面生成或仿真創(chuàng)建任務，則可以讓模型多花一點時間推理，把結果做扎實。

這種「既要又要」的能力，也因此收獲了相當不錯的成績單。在 Arena.ai 的排行榜中，它的 Elo 分數(shù)達到了 1432，在 GPQA Diamond（研究生級別的問答）測試中拿到了 86.9% 的準確率。

在學術評測 GPQA Diamond 上得分 86.9%，多模態(tài)理解 MMMU Pro 上達到 76.8%。這兩個數(shù)字不只是「在同檔位里還不錯」，而是直接超過了體量更大的 Gemini 2.5 Flash。

注意，這里對比的是 Gemini 2.5 Flash 而非 Gemini 3 Flash，顯然雞賊的 Google 對這款模型也并未抱有多大的信心。

目前，3.1 Flash-Lite 以預覽版形式通過 Google AI Studio 和 Gemini API 向開發(fā)者開放，企業(yè)用戶可通過 Vertex AI 接入。Latitude、Cartwheel、Whering 等早期合作伙伴已在生產環(huán)境中完成測試，普遍認可它在大規(guī)模調用下的穩(wěn)定性和指令遵循能力。

把這兩個模型放在一起看，你會發(fā)現(xiàn)「Instant」和「Lite」，或許正在找到自己最合適的位置。

以最近大火的 OpenClaw 為例，其核心場景是幫用戶處理郵件、管理日程，本質上是一個需要自主執(zhí)行任務的 Agent。

這類產品對模型的要求，和普通 chatbot 聊天工具完全不同：它不需要模型表演得多聰明，它需要模型說人話、不出錯、還得扛得住高頻調用。

GPT-5.3 Instant 顯著降低幻覺率，意味著 Agent 在自主執(zhí)行任務時少犯錯；「AI 腔」的消退，意味著生成的郵件、文檔讀起來更貼合真人的閱讀習慣。

Gemini 3.1 Flash-Lite 則更符合最為關鍵的第三個需求。Agent 在后臺狂奔時，往往需要并行處理海量的子任務，對響應速度和 API 成本極度敏感。

Flash-Lite 極快的響應速度和白菜價的成本，加上能靈活調配算力的「思考等級」，這種極具彈性的架構對高并發(fā)的自動化任務而言，無疑是久旱逢甘霖。

即便兩款模型的長期穩(wěn)定性仍需觀察，但大方向已經(jīng)很明確：一個負責讓交互更像人，一個死磕更快更省錢。在未來人手一只「龍蝦」的情況下，輕量模型將成為更自然、務實的選擇。

更多>同類資訊

智元機器人亮相MWC2026：遠征A2接待西班牙國王

03-04

MiniMax把難題留給了對手

03-04

英特爾董事長退休曾主導四次CEO更迭、挑選了陳立武

03-04

肯尼亞外包工揭露Meta智能眼鏡數(shù)據(jù)內幕

03-04

Meta加入AI購物大戰(zhàn)，挑戰(zhàn)ChatGPT和Gemini

03-04

Meta在Reality Labs部門組建新AI工程團隊

03-04

谷歌Gemini 3.1 Flash-Lite發(fā)布：速度快成本低，多模態(tài)與推理能力再升級

03-04

佰維存儲業(yè)績飆升：2026年前兩月凈利潤超去年全年兩倍

03-04

拼豆熱潮席卷年輕人：從解壓新寵到IP融合新載體，小豆子撬動大市場

03-04

AMD蘇姿豐：AI算力需求多樣，異構計算成趨勢，回應CPU供應與內存漲價

03-04

iPhone 17e：4499元起售，蘋果以AI利刃直插中端手機市場腹地

03-04

中興MWC26展AI新成果：努比亞豆包手機海外首秀，情感陪伴iMoochi登場

03-04

GPT-5.3 Instant與Gemini 3.1 Flash-Lite同臺競技，輕量模型迎來新突破

03-04

智元機器人MWC2026展風采：遠征A2接待國王，RaaS租賃模式覆蓋17國

03-04

谷歌Gemini 3.1 Flash-Lite登場：速度與成本雙突破，性能越級挑戰(zhàn)

03-04

點擊查看更多 +

全站最新

中國2月RatingDog綜合PMI升至55.4 增速創(chuàng)33個月最高

港股油氣設備與服務股連漲兩日后回調，百勤油服跌超33%，山東墨龍跌超15%

A股異動丨美元走強金價回調！黃金概念股集體下跌，曼卡龍跌超8%，西部黃金跌超4%

A股異動丨“戰(zhàn)爭金屬”價格飆升，相關概念股走強，東方鋯業(yè)、章源鎢業(yè)漲停

A股異動丨業(yè)績亮眼！存儲芯片股全線上漲，佰維存儲、德明利漲停

A股農業(yè)股逆勢普漲，農發(fā)種業(yè)逼近漲停

熱門內容

本欄最新

塔吉特連續(xù)13季銷售疲軟，新CEO出招：優(yōu)化商品升級技術謀轉型

優(yōu)推信息：借百家號搜狐號內容運營，以排名助力品牌資產長效沉淀

馬云攜阿里螞蟻核心管理層齊聚云谷，共探AI時代教育新方向

雷軍談新能源汽車輔助駕駛：當前仍需司機主導，尚未達L3L4級別

MWC大會上科大訊飛全球首秀AI眼鏡，僅40克，多模態(tài)同傳助力跨語言溝通

科大訊飛AI眼鏡MWC 2026首秀：唇動降噪提準率，40克輕體適配多商務場景

本網(wǎng)站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

GPT-5.3新模型撞車Gemini