近日,比利時布魯塞爾自由大學(VUB)發布了一項足以載入 AI 史冊的研究成果:商用大模型已具備獨立生成原創數學證明的能力。實驗顯示,OpenAI 旗下的 ChatGPT-5.2 (Thinking) 成功破解了由數學家 Ran 與 Teng 在 2024 年提出的懸而未決的數學猜想。
圖源備注:圖片由AI生成,圖片授權服務商Midjourney
這一突破標志著大語言模型(LLM)的邊界正式超越了代碼輔助與文本創作,跨入了需要極高邏輯嚴密性的理論數學領域。數學界對此反應強烈,認為這預示著科學發現的范式正在發生根本性變革。
“氛圍證明”橫空出世:從對話中誕生的數學定理研究團隊將這種全新的科研模式命名為“vibe-proving(氛圍證明)”,其靈感源自近期火爆的“氛圍編程”。在整個證明過程中,ChatGPT 獨立承擔了證明路徑的探索與核心邏輯框架的搭建,展現了超越數據組合的原創推理能力。
整個證明歷經 7 輪對話交互與 4 個版本的自我迭代,最終形成了一套嚴謹的邏輯論證。盡管人類研究人員仍負責最后的校驗工作,但 AI 表現出的推演效率遠超人類數學家的預期。
行業重心位移:人類將從“生產者”轉型為“驗證者”VUB 教授 Vincent Ginis 指出,這項成果打破了“AI 只有歸納能力而無創造力”的固有偏見。隨著 AI 生成數學證明的門檻降低,理論數學的研究速度有望得到指數級提升。
未來數學界的核心瓶頸將從“尋找證明路徑”轉向“邏輯正確性校驗”。當 AI 能夠大規模產出高質量的猜想候選證明時,如何高效、自動化地完成人類驗證,將成為下一個技術爭奪的高地。











