西湖大學科研團隊在人類基因組研究領域取得重大突破。由楊劍教授領銜的研究組聯合國內外合作伙伴,開發出基于泛基因組的聯合組裝技術(PIGA),成功構建出包含1116個二倍體基因組的全球最大規模人類泛基因組圖譜。這項成果不僅填補了傳統基因組研究的空白,更在遺傳疾病診斷領域開辟了新路徑。
自2003年人類基因組計劃完成以來,全球科研界長期依賴單一參考基因組開展研究。但這種"標準模板"存在顯著缺陷:其未能涵蓋人類群體中約13%的遺傳信息,導致對個體差異的解釋力不足。傳統泛基因組研究雖嘗試突破,但受制于三代測序技術的高昂成本,樣本規模始終難以突破百人級別,無法全面反映人類遺傳多樣性。
研究團隊創新性地采用二代與三代測序技術混合策略,通過二代測序確保數據準確性,三代測序構建基因組框架,在保證質量的同時將成本降低至傳統方法的三分之一。這種技術組合使大規模基因組組裝成為可能,最終構建的泛基因組錯誤率控制在五萬分之一以下,達到國際領先水平。
新發現的遺傳信息中包含2620萬堿基對的功能性元件,這些區域參與蛋白質合成和基因表達調控。研究團隊繪制的變異圖譜涵蓋3540萬個小變異,并首次系統解析了結構變異、串聯重復序列等復雜變異形式。特別值得關注的是,科研人員定位到3256個影響基因表達的關鍵變異位點,為阿爾茨海默病、癌癥等復雜疾病的遺傳機制研究提供了重要線索。
"大樣本量是解析罕見病的關鍵。"楊劍教授指出,傳統研究常因樣本不足而忽視低頻變異,新方法使復雜變異的檢出率提升3倍以上。以脊髓性肌萎縮癥為例,新發現的調控變異可解釋約5%的未知病例,為臨床診斷提供了新的分子標記。
這項研究還修正了傳統基因組4億余堿基對的缺失信息,相當于為生命"地圖"補全了13%的關鍵區域。這些新序列分布在基因組的"暗物質"區域,包含大量非編碼RNA和順式調控元件,可能參與細胞分化、免疫應答等核心生命過程。目前研究團隊已建立公開數據庫,全球科研人員可免費獲取相關數據用于疾病研究和新藥開發。











