比利時布魯塞爾自由大學(xué)近日公布了一項在人工智能領(lǐng)域具有里程碑意義的研究成果:商用大型語言模型已具備獨立推導(dǎo)原創(chuàng)數(shù)學(xué)證明的能力。實驗中,OpenAI研發(fā)的ChatGPT-5.2(Thinking)成功攻克了數(shù)學(xué)家Ran與Teng于2024年提出的未解數(shù)學(xué)猜想,這一突破性進展引發(fā)了科學(xué)界的廣泛關(guān)注。
該研究團隊將這一新型科研模式命名為“氛圍證明”(vibe-proving),其概念源于近年來興起的“氛圍編程”理念。與傳統(tǒng)數(shù)學(xué)證明依賴人類數(shù)學(xué)家逐步推導(dǎo)不同,ChatGPT在證明過程中完全自主完成了邏輯路徑的探索與核心框架的構(gòu)建。通過7輪對話交互與4次自我迭代優(yōu)化,AI最終形成了嚴密的數(shù)學(xué)論證體系,僅需人類研究者進行最終校驗。
數(shù)學(xué)界對這一成果反應(yīng)熱烈。專家指出,該研究首次證明大型語言模型不僅具備數(shù)據(jù)歸納能力,更能進行創(chuàng)造性邏輯推理。布魯塞爾自由大學(xué)教授Vincent Ginis強調(diào),這項發(fā)現(xiàn)徹底顛覆了“AI缺乏原創(chuàng)思維”的傳統(tǒng)認知,標(biāo)志著人工智能正式進入需要高度抽象思維的理論數(shù)學(xué)領(lǐng)域。
隨著AI證明生成技術(shù)的成熟,數(shù)學(xué)研究范式正面臨深刻變革。傳統(tǒng)研究中“尋找證明路徑”的瓶頸問題將逐步被“邏輯正確性驗證”所取代。當(dāng)AI能夠批量生成高質(zhì)量數(shù)學(xué)證明時,如何建立自動化驗證系統(tǒng)將成為新的技術(shù)競爭焦點。研究團隊預(yù)測,未來數(shù)學(xué)家的核心工作可能轉(zhuǎn)向設(shè)計更高效的驗證算法,而非直接參與證明推導(dǎo)過程。
這項突破也引發(fā)了關(guān)于科研主體性的討論。盡管當(dāng)前AI仍需人類進行最終驗證,但其推演效率已遠超傳統(tǒng)方法。實驗數(shù)據(jù)顯示,ChatGPT在48小時內(nèi)完成的證明推導(dǎo),相當(dāng)于人類數(shù)學(xué)家數(shù)月的工作量。這種效率差距正在迫使科學(xué)界重新思考人機協(xié)作的邊界與模式。













