3月31日消息,近日,百度文心衍生模型PaddleOCR在GitHub上的Star數突破73.3K,首次超越谷歌旗下開源OCR標桿產品Tesseract OCR(73.2K),成為全球Star數最高的OCR項目。
Tesseract OCR誕生于1985年,最初由惠普實驗室研發,2005年開源后由Google接手維護并持續迭代,是OCR領域延續近四十年的技術標桿,長期位居GitHub OCR項目Star數榜首。
此次被PaddleOCR超越,標志著這一標桿正在被新一代技術體系改寫,也是大模型驅動下中國開源項目首次在OCR領域超越谷歌主導的標桿產品。
PaddleOCR基于文心大模型訓練而來,是文心大模型多模態能力的重要部分,支持超100種語言識別,用戶覆蓋160個國家和地區。1月29日,新一代文檔解析模型PaddleOCR-VL-1.5在 OmniDocBench V1.5 榜單中取得了全球SOTA成績。
近年來,大模型成為OCR賽道增長的重要動力。Star History數據顯示,PaddleOCR在GitHub上的Star自2024年起呈現爆發式增長。2025年以來,OCR更成為大模型廠商布局的重點方向,DeepseekOCR、HunyuanOCR、GLM OCR等產品相繼發布。
PaddleOCR同步升級服務能力:官網免費每日解析頁數由1萬提升至2萬,用戶還可通過OpenClaw直接調用PaddleOCR Skill,免費獲取高精度PDF解析能力。
與此同時,PaddleOCR OCEAN生態聯盟正式成立,面向核心開源貢獻者、深度企業用戶及全球平臺伙伴開放,首批成員包括Hugging Face、Dify、RAGFlow、Cherry Studio、Milvus等全球平臺伙伴,將共同推動OCR技術在更廣泛場景中的應用落地。
ps.OCR(Optical Character Recognition,光學字符識別)是指通過光學設備(如掃描儀、攝像頭)獲取圖像中的文本信息,再通過計算機算法將其轉化為可編輯、可檢索、可分析的數字文本的技術。簡單來說,就是讓計算機看見并讀懂圖像中的文字,實現 "圖像文本→數字文本" 的精準轉化。








