在人工智能與生物醫藥深度融合的浪潮中,國產科研力量正推動技術突破從概念驗證走向產業化應用。清華大學智能產業研究院與水木分子團隊近日聯合宣布,全球首個化學分子通用基座模型BioMedGPT-Mol正式開源,為藥物研發領域注入智能化新動能。
該模型突破了傳統AI工具在化學領域的應用局限,通過構建分子結構的數字表征體系,實現了對化學鍵、立體構型及物化屬性的系統性解析。研發團隊介紹,其核心優勢在于將分子信息轉化為可計算的數字語言,使模型具備跨任務遷移能力,在虛擬篩選、活性預測、分子設計等場景中展現出顯著優勢。
區別于針對特定靶點開發的專用模型,BioMedGPT-Mol采用預訓練架構設計,通過海量分子數據訓練形成通用知識底座。這種技術路線不僅降低了后續微調成本,更使模型能夠適應不同研發階段的需求變化。實驗數據顯示,經過少量領域數據微調后,模型在多個基準測試中達到行業領先水平。
開源策略成為該項目的關鍵創新點。研究團隊將完整模型架構、訓練代碼及預訓練權重全部公開,配套提供分子表示轉換工具包。這種開放模式有效破解了中小藥企的技術壁壘,據測算可使新藥研發周期縮短30%以上,顯著降低早期探索階段的資金投入。
生物醫藥行業專家指出,該模型的推出標志著化學信息學進入"數字原生"時代。隨著預訓練范式在生命科學領域的普及,分子發現過程正從經驗驅動轉向數據驅動,這為攻克罕見病治療、抗生素耐藥等全球性醫療難題提供了新的技術路徑。目前,全球已有數十家科研機構下載使用該模型,相關應用成果正在陸續披露中。











