滾動資訊

當前位置：首頁 > 資訊 > 信息流 > 正文內容

DeepSeek-OCR 2模型革新：AI智能排序視覺內容精準“讀透”復雜文檔

時間：2026-01-28 03:00:20 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

DeepSeek團隊近日宣布開源新一代文字識別模型DeepSeek-OCR 2，并同步發布技術論文《DeepSeek-OCR 2: Visual Causal Flow》。該模型通過引入動態視覺處理機制，在復雜文檔解析任務中展現出顯著優勢，尤其在中文場景下實現了關鍵技術突破。

傳統視覺語言模型采用固定柵格順序處理圖像，將畫面切割為視覺token后按從左到右、從上到下的路徑輸入神經網絡。這種處理方式雖實現簡單，卻與人類閱讀習慣存在本質差異——人類在解讀文檔時，會基于語義關聯和邏輯關系進行跳躍式信息捕捉，而非機械遵循空間坐標。DeepSeek團隊通過重構編碼器架構，使模型能夠自主分析視覺元素的因果關系，構建符合認知規律的動態處理路徑。

新型DeepEncoder V2編碼器是該模型的核心創新。該結構通過引入注意力機制，使模型在識別文字前先對視覺內容進行語義排序。例如在解析數學公式時，模型會優先定位主運算符，再按運算優先級處理相關數字和符號；處理表格時則能自動識別表頭與數據行的對應關系。這種處理方式突破了傳統模型對空間坐標的依賴，在版式復雜的文檔場景中表現尤為突出。

在OmniDocBench v1.5基準測試中，研究團隊設置了嚴苛的對比條件：將視覺token數量上限降低15%的情況下，新模型仍取得91.09%的綜合得分，較前代提升3.73個百分點。具體到關鍵指標，閱讀順序準確度（編輯距離）從0.085優化至0.057，意味著模型對文檔結構的理解更接近人類認知模式。測試樣本覆蓋學術論文、財務報表、法律文書等12類中英文文檔，充分驗證了模型的泛化能力。

技術文檔顯示，動態路徑規劃機制通過三階段實現：首先利用輕量化網絡提取視覺特征，再通過圖神經網絡構建元素關聯圖譜，最后采用強化學習算法優化處理順序。這種分層設計使模型在保持高效的同時，具備處理超長文檔的能力。開發團隊特別強調，中文文檔的復雜版式對模型提出更高要求，新架構通過引入筆畫順序先驗知識，顯著提升了漢字識別準確率。

目前，DeepSeek-OCR 2的源代碼和預訓練權重已向學術界和產業界開放。開發者可通過GitHub獲取完整工具包，支持快速部署于文檔數字化、智能辦公、金融風控等場景。測試數據顯示，在同等硬件條件下，新模型處理速度較前代提升22%，內存占用減少18%，為移動端部署創造了可能。

更多>同類資訊

海南商發二號發射工位“四缸”調試成功，助力更大火箭發射任務

02-07

最新研究：木星尺寸“更新” 赤道半徑略減卻更顯扁態

02-07

國產首臺盾構飽和帶壓進倉設備“深海空間站”首秀成功助力深埋跨海隧道建設

02-07

海南商發二號發射工位“四缸”調試成功助力大型火箭發射任務

02-07

海南商發二號發射工位“四缸”調試成功，為更大火箭發射筑牢技術根基

02-07

太空光伏：從概念到產業新藍海，開啟能源革命新篇章

這一閉環生態將太空通信、地面能源與人工智能算力需求緊密串聯，凸顯了能源在未來的核心基礎地位。面向未來，兩種技術路線正展現巨大潛力：異質結電池在性能與成本間取得了良好平衡，其超薄化、柔性化的特點完美適配低軌衛星…

02-07

全球各國央行日益青睞從美聯儲"挖角"頂尖人才

02-07

青藏高原蛇綠巖藏天然氫氣“密碼” 為清潔能源勘探指明新方向

記者從中國科學院地質與地球物理研究所獲悉，該研究所劉傳周和吳福元領銜的研究團隊在青藏高原的蛇綠巖中，首次發現了封存于微觀包裹體內的天然氫氣。這一發現，完整勾勒出天然氫氣從深部生成、遷移到近地表聚集的“源—匯”…

02-07

洋山港1月干線集裝箱船舶流量首破800艘次，創歷史新高

02-07

澤連斯基：俄軍襲擊導致烏克蘭多地大規模停電

02-07

澤連斯基：不支持違反烏克蘭憲法的和平協議

02-07

沙特宣布對敘利亞進行重大投資

02-07

俄羅斯一醫學院發生襲擊事件多人受傷

02-07

海外并購資產遭遇強制出售，“FTDI案”進入關鍵節點

02-07

千問APP免單繼續！用AI買盒馬，買魚買菜買年貨、一句話送到家

02-07

點擊查看更多 +

全站最新

比亞迪方程豹鈦7第三次OTA升級來襲，16項新增7項優化暢享智駕新體驗

沃爾沃ES90純電轎車現身公示名單，車長5米多款電機配置可選

阿維塔06T現身工信部公告：車身尺寸亮眼，搭載華為激光雷達與寧德電池

新款極氪007及007GT申報圖亮相，900V架構加持，二季度煥新登場

千問APP免單繼續！用AI買盒馬，買魚買菜買年貨、一句話送到家

“碰一下開門”覆蓋1.5萬小區淘寶閃購助力騎士送單提速暢通外賣“最后100米”

熱門內容

本欄最新

千問APP免單繼續！用AI買盒馬，買魚買菜買年貨、一句話送到家

“碰一下開門”覆蓋1.5萬小區淘寶閃購助力騎士送單提速暢通外賣“最后100米”

馬斯克回應SpaceX推遲火星計劃優先推進月球任務

燧原科技沖擊IPO，聚焦AI芯片領域，三年多虧損超51億

創新藥強復蘇！CRO二波行情已啟動？這波機會別錯過！

北汽極狐首款高端MPV命名將于近期公布

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

DeepSeek-OCR 2模型革新：AI智能排序視覺內容 精準“讀透”復雜文檔

DeepSeek-OCR 2模型革新：AI智能排序視覺內容精準“讀透”復雜文檔