滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 信息流 > 正文內(nèi)容

DeepSeek-OCR 2革新登場(chǎng)：視覺編碼升級(jí)，文檔識(shí)別性能與穩(wěn)定性雙提升

時(shí)間：2026-01-27 19:07:33 來(lái)源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評(píng)論無(wú)障礙通道

文檔識(shí)別領(lǐng)域迎來(lái)重要進(jìn)展，DeepSeek團(tuán)隊(duì)正式推出新一代文檔識(shí)別模型DeepSeek-OCR 2。該模型在繼承前代架構(gòu)優(yōu)勢(shì)的基礎(chǔ)上，通過(guò)創(chuàng)新性的視覺編碼器設(shè)計(jì)，實(shí)現(xiàn)了對(duì)復(fù)雜文檔結(jié)構(gòu)更精準(zhǔn)的解析能力。

傳統(tǒng)視覺語(yǔ)言模型在處理文檔圖像時(shí)，通常采用固定柵格順序切割視覺元素，這種處理方式雖便于實(shí)現(xiàn)，卻與人類閱讀時(shí)的語(yǔ)義跳躍特性存在顯著差異。特別是在學(xué)術(shù)論文、財(cái)務(wù)報(bào)表等版式復(fù)雜的場(chǎng)景中，視覺元素間的邏輯關(guān)聯(lián)往往超越空間位置關(guān)系，單純依賴空間順序的解析方式容易產(chǎn)生理解偏差。

研究團(tuán)隊(duì)提出的DeepEncoder V2架構(gòu)突破了這一局限。該架構(gòu)通過(guò)引入"視覺因果流"機(jī)制，使編碼器能夠動(dòng)態(tài)調(diào)整視覺token的處理順序。具體實(shí)現(xiàn)上，系統(tǒng)同時(shí)運(yùn)行雙向注意力與因果注意力兩種模式：前者負(fù)責(zé)全局視覺信息感知，后者通過(guò)可學(xué)習(xí)的因果查詢token逐步構(gòu)建語(yǔ)義順序。這種雙重注意力機(jī)制確保模型在編碼階段就能完成視覺元素的智能排序。

在架構(gòu)設(shè)計(jì)方面，新模型延續(xù)了編解碼框架但進(jìn)行了關(guān)鍵優(yōu)化。編碼器先將圖像壓縮為256-1120個(gè)視覺token，經(jīng)DeepEncoder V2重組語(yǔ)義順序后，交由基于混合專家架構(gòu)（MoE）的語(yǔ)言模型解碼。這種設(shè)計(jì)在保持計(jì)算效率的同時(shí)，將解碼負(fù)擔(dān)控制在合理范圍內(nèi)，資源消耗與前代模型基本持平。

性能驗(yàn)證在OmniDocBench v1.5基準(zhǔn)測(cè)試中進(jìn)行，該測(cè)試集包含中英文學(xué)術(shù)論文、商業(yè)報(bào)告等12類文檔。實(shí)驗(yàn)數(shù)據(jù)顯示，在視覺token數(shù)量減少的情況下，新模型整體識(shí)別準(zhǔn)確率達(dá)91.09%，較前代提升3.73個(gè)百分點(diǎn)。特別在閱讀順序指標(biāo)上，編輯距離從0.085優(yōu)化至0.057，證明其對(duì)文檔結(jié)構(gòu)的理解能力顯著增強(qiáng)。

實(shí)際應(yīng)用表現(xiàn)同樣亮眼。生產(chǎn)環(huán)境測(cè)試顯示，在線用戶日志圖像的重復(fù)識(shí)別率下降33%（從6.25%降至4.17%），PDF批處理數(shù)據(jù)的重復(fù)率降低22%（從3.69%降至2.88%）。這些改進(jìn)表明模型在保持高壓縮率的同時(shí)，有效提升了復(fù)雜場(chǎng)景下的處理穩(wěn)定性。

02-20

土星環(huán)與土衛(wèi)六起源或有新解：數(shù)億年前衛(wèi)星碰撞造就今日奇觀

02-20

土衛(wèi)六與土星環(huán)或源于衛(wèi)星大碰撞未來(lái)十年“蜻蜓號(hào)”或揭秘

02-20

我國(guó)科學(xué)家突破“帶寬鴻溝” 新系統(tǒng)刷新光通信與6G融合傳輸速率紀(jì)錄

新華社北京2月19日電（記者魏夢(mèng)佳）我國(guó)科學(xué)家近日在光通信和6G領(lǐng)域取得突破性進(jìn)展，在國(guó)際上率先實(shí)現(xiàn)光纖通信和無(wú)線通信系統(tǒng)間的跨網(wǎng)絡(luò)融合，自主研發(fā)的“光纖—無(wú)線一體化融合通信系統(tǒng)”的數(shù)據(jù)傳輸速率刷新紀(jì)錄。王…

02-20

港股異動(dòng)丨發(fā)盈喜，速騰聚創(chuàng)大漲超15%

02-20

港股異動(dòng)丨存儲(chǔ)概念走強(qiáng)，南方兩倍做多海力漲近6%，南方兩倍做多三星漲近4%

02-20

美國(guó)加州雪崩致9名滑雪者死亡

02-20

璋利國(guó)際創(chuàng)歷史新高

02-20

港股異動(dòng)丨春晚機(jī)器人出圈，相關(guān)概念股集體大漲，優(yōu)必選漲近9%

02-20

古巴外長(zhǎng)：美經(jīng)濟(jì)封鎖致古巴一年損失超70億美元

02-20

港股異動(dòng)丨石油股逆勢(shì)走強(qiáng)，中國(guó)石油股份漲超4%

02-20

OpenAI創(chuàng)始人：超級(jí)智能將能夠勝任一家大型公司的CEO，比任何高管都做得更好，包括我自己

02-20

春節(jié)假期迎返程客流攀升國(guó)鐵廣州局預(yù)計(jì)20日到達(dá)旅客突破200萬(wàn)人次

02-20

有中國(guó)公民在街頭遇襲我駐奧克蘭總領(lǐng)館：嚴(yán)重關(guān)切

02-20

美元指數(shù)突破98

02-20

點(diǎn)擊查看更多 +

全站最新

職場(chǎng)溝通新利器：三款耳機(jī)大比拼，哪款能讓你會(huì)議溝通更高效？

雙11耳機(jī)選購(gòu)指南：森海塞爾與科大訊飛，哪款更適合你的生活節(jié)奏？

港股異動(dòng)丨發(fā)盈喜，速騰聚創(chuàng)大漲超15%

港股異動(dòng)丨存儲(chǔ)概念走強(qiáng)，南方兩倍做多海力漲近6%，南方兩倍做多三星漲近4%

港股異動(dòng)丨春晚機(jī)器人出圈，相關(guān)概念股集體大漲，優(yōu)必選漲近9%

港股異動(dòng)丨石油股逆勢(shì)走強(qiáng)，中國(guó)石油股份漲超4%

熱門內(nèi)容

本欄最新

港股異動(dòng)丨發(fā)盈喜，速騰聚創(chuàng)大漲超15%

港股異動(dòng)丨存儲(chǔ)概念走強(qiáng)，南方兩倍做多海力漲近6%，南方兩倍做多三星漲近4%

港股異動(dòng)丨春晚機(jī)器人出圈，相關(guān)概念股集體大漲，優(yōu)必選漲近9%

港股異動(dòng)丨石油股逆勢(shì)走強(qiáng)，中國(guó)石油股份漲超4%

港股三大指數(shù)低開

港股異動(dòng)丨速騰聚創(chuàng)逆勢(shì)高開超4%，預(yù)計(jì)首次實(shí)現(xiàn)單季度盈利6000萬(wàn)

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

DeepSeek-OCR 2革新登場(chǎng)：視覺編碼升級(jí)，文檔識(shí)別性能與穩(wěn)定性雙提升