在基因組研究領(lǐng)域,一項突破性成果引發(fā)廣泛關(guān)注。谷歌旗下“深層思維”公司開發(fā)的AlphaGenome深度學習模型,成功解碼了人類基因組中98%的非編碼區(qū)域——這些區(qū)域被科學界稱為“暗基因組”,此前因功能未知而成為研究難點。該模型的相關(guān)成果近日發(fā)表于英國《自然》雜志封面文章,標志著人類對自身遺傳信息的理解邁出重要一步。
該模型通過整合人類與小鼠基因組數(shù)據(jù),構(gòu)建了能夠預測長序列DNA功能的算法框架。與傳統(tǒng)方法需要在分析范圍與精度間取舍不同,AlphaGenome可同時處理長達100萬個堿基對的序列,并實現(xiàn)高分辨率預測。其功能不僅限于定位基因位置,更能模擬“暗基因組”對基因表達、剪接等過程的調(diào)控作用,甚至能評估單個堿基變異產(chǎn)生的分子影響。
在26項獨立基準測試中,AlphaGenome模型在25項任務中達到或超越現(xiàn)有最優(yōu)水平。研究團隊特別強調(diào),該模型在解析非編碼區(qū)變異方面的表現(xiàn)尤為突出,這為理解復雜疾病機制提供了全新視角。例如,某些精神疾病或癌癥的致病突變可能位于傳統(tǒng)基因檢測盲區(qū),而AlphaGenome的預測能力有望填補這一空白。
自去年向非商業(yè)用途開放以來,已有來自全球的3000名科研人員使用該工具。盡管開發(fā)者坦言模型仍存在改進空間,但學界普遍給予高度評價。有專家指出,這一成果不僅加速了基因組功能注釋的進程,更為開發(fā)針對非編碼區(qū)變異的新型療法奠定了基礎(chǔ)。隨著更多研究者參與完善模型,人類對遺傳密碼的解讀或?qū)⑦M入全新階段。











