滾動資訊

當前位置：首頁 > 資訊 > 信息流 > 正文內容

專為科研設計！AI模型“OpenScholar”引文準確率媲美人類專家

時間：2026-02-05 10:22:42 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

在科學研究的領域中，文獻綜述一直是支撐循證決策、優化科研流程以及啟發新發現的關鍵環節。然而，隨著科學文獻數量的爆炸式增長，科研人員要全面掌握相關資訊變得愈發困難。盡管商用大語言模型在一定程度上能夠提供協助，但它們在處理科學文獻時往往存在歸因能力不足和引文幻覺等問題，給科研工作帶來諸多困擾。

為解決這一難題，美國華盛頓大學的研究團隊開發了一款名為“OpenScholar”的開源語言模型。該模型是專門為科研任務設計的檢索增強語言模型，通過將特定框架與包含4500萬篇最新開放獲取科研論文的專業數據庫相結合，并引入自我評估機制，顯著優化了其輸出結果。這一創新設計使得“OpenScholar”在準確進行文獻綜述方面表現出色，甚至超越了部分商用大語言模型。

在實驗測試中，“OpenScholar”展現出了卓越的性能。與GPT4o相比，后者在78%至90%的情況下會出現引文幻覺，而“OpenScholar”的引文準確率則與人類專家相近。研究團隊還創建了名為“ScholarQABench”的基準工具來評估文獻綜述的自動化水平。測試結果顯示，“OpenScholar”的準確率比GPT4o和PaperQA2（另一款文獻綜述工具）分別高出6.1%和5.5%。更令人矚目的是，在50%到70%的情況下，“OpenScholar”生成的答案比專家注釋器的答案更具實用性。

“OpenScholar”的出現，為科研人員提供了一種更為可靠和高效的文獻綜述工具。它不再追求通用性，而是專注于科學文獻這一特定領域，力求提供準確、全面且透明的綜述結果。這一特點使得科研人員能夠更快速地篩選出有價值的信息，減少在繁瑣文獻中耗費的時間和精力。

盡管“OpenScholar”在文獻綜述方面取得了顯著進展，但研究團隊也指出，該系統仍存在一定的局限性。他們強調，基于語言模型的系統無法完全實現科學文獻綜述的自動化，仍需要科研人員的專業判斷和干預。為了推動該工具的進一步優化和完善，研究團隊向學界開放了“ScholarQABench”和“OpenScholar”，鼓勵更多科研人員參與研究和改進工作。

對于科研人員而言，“OpenScholar”的出現無疑是一個福音。它如同一張專門為科學海洋設計的網，能夠幫助他們更精準地捕捉到真正有價值的信息，避免被虛假或錯誤的引文所誤導。這一創新工具有望將科研人員從繁瑣、易錯的文獻綜述工作中部分解放出來，讓他們能夠將更多的精力投入到真正的思考和發現中。

更多>同類資訊

香港灣仔海濱2026架無人機閃耀夜空共繪馬年新春美好愿景

2月14日，人們在香港灣仔海濱觀看、拍攝無人機表演。一場由2026架無人機呈現的大型無人機表演，14日晚在香港灣仔海濱舉行，為即將到來的馬年新春增添喜慶祥和的節日氣氛。表演開始，巨型金色“馬”字在維港…

02-16

本土工業控制器崛起：從15%到30%的國產化突圍之路

02-16

賓利歐陸SC：可拆卸車頂詮釋奢華，低里程珍品即將拍賣引關注

02-16

DeepSeek更新引熱議：性格“變冷”上熱搜，V4編程實力或顛覆格局

如今，全網都在蹲DeepSeek V4了。這幾天，很多人都發現突然間，DeepSeek的性格變了。比起DeepSeek變冷淡，全網更在乎的是，V4到底哪天出世？這意味著模型在整個訓練流程中對數據模式的理解…

02-16

肇慶高要無人機“出征”春運，空地聯動織密道路安全“防護網”

為應對春運期間激增的交通壓力，肇慶市高要區“百縣千鎮萬村高質量發展工程”指揮部信息化建設專班將無人機巡檢系統深度嵌入交通保障全流程，以“空中調度+地面聯動”模式，為轄區道路疏堵保暢插上科技翅膀。專班表示，返程…

02-16

火星最年輕火山：單次噴發表象下，隱藏著怎樣復雜的巖漿活動？

02-16

熱門PC游戲光追支持率低：21款大作僅5款支持，光追應用尚待普及

02-15

國聯民生上訴龍力案二審啟動歷史風險處置成持續發展關鍵議題

02-15

新宙邦：電解液回暖利潤遜色，固態電池布局下港股IPO擴產路幾何？

02-15

國鐵廣州局筑牢粵湘電煤運輸保障線

02-15

歐洲央行行長拉加德反對通過征稅阻止資本外流

02-15

機構：三線以下城市游客預訂景區門票增三成

02-15

京和文旅2025：堅守耕耘共成長，攜手啟航新征程

02-15

分析師：特朗普政府中期選舉的成敗可能取決于選民是否切實感受到日常生活有所改善

02-15

陶冬：2026年AI行業將進入洗牌階段，財務脆弱的公司可能因融資困境引發連鎖反應

02-15

點擊查看更多 +

全站最新

問界M8斬獲“風云2025智行汽車” 問界以智慧科技引領高端智能汽車新未來

馬自達未棄轉子發動機：雖不量產性能車，但仍有希望盼未來

總臺第六屆《汽車風云盛典》啟幕以“全維安全”引領汽車產業新征程

觸屏操作遇挑戰！新規推動駕駛核心功能回歸實體按鍵科技與安全并重

馬自達6e英國上市，售價超中國兩倍，這差價背后藏著啥秘密？

北汽極狐阿爾法S5煥新登場！增程版上線，續航焦慮不再有

熱門內容

本欄最新

賓利歐陸SC：可拆卸車頂詮釋奢華，低里程珍品即將拍賣引關注

歸鄉記 | 每年一次的人口大遷徙

千問第二波免單恰逢情人節，縣城鐘點房幫訂量暴增約300%

國家網信辦公布境內第四批7家金融信息服務機構

北京無限宇航自研100N雙組元液體火箭發動機高模試車成功性能達國際領先

心愛新能源2026戰略發布：以產品創新為翼，向行業第一梯隊振翅高飛

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

專為科研設計！AI模型“OpenScholar”引文準確率媲美人類專家