傳音持續深化AI領域的產學研協同,積極推動與國內外知名高校的深度合作,圍繞AI視覺、語音、語言與大模型等方向推進協同創新。日前,傳音TEX AI中心與中山大學、穆罕默德·本·扎耶德人工智能大學(Mohamed bin Zayed University of Artificial Intelligence,簡稱MBZUAI)聯合開展的“拍照解題”項目研究取得重要進展,相關成果論文已被計算機視覺領域的國際頂級學術會議CVPR 2026正式錄用。

CVPR是IEEE主辦的計算機視覺與模式識別領域的頂級會議,是中國計算機學會(CCF)推薦的A類會議,它與ICCV、ECCV并稱為計算機視覺領域“三大頂會”。據最新數據,CVPR 2026共有逾三萬人投稿,在進入評審流程的16,092篇有效文章中,最終接收率僅25.42%,每篇論文都必須通過3-5位全球頂尖專家的雙盲評審。

近年來,AI大模型在邏輯推理與復雜問題求解方面的能力持續提升,但在實際應用中,其在復雜數學題上的處理表現仍存在不足。例如,解題結果正確但推理過程存在邏輯漏洞,或步驟看似完整但實際推導錯誤。這類問題在學習場景中尤為關鍵,相較于答案本身,推理過程的準確性更直接影響學生對知識的理解與掌握。
針對這一問題,傳音TEX AI中心與中山大學、MBZUAI團隊合作,開發了CARE(Contrastive Anchored REflection)技術,從訓練機制上對傳統路徑進行了優化。不同于僅以“結果對錯”作為反饋信號的方式,CARE技術將關注點前移到推理過程本身,重點引入“高質量錯誤樣本”——即那些接近正確但存在關鍵步驟偏差的解題路徑。通過將這類樣本與標準解法進行對比分析,并結合反思式重推理機制,模型能夠識別具體錯誤環節,并完成自我修正,從而形成更穩定、連貫的推理能力。在引入反思機制后,模型對復雜問題的二次推理成功率由約10%–19%提升至76.6%,有效增強了面對復雜題目時的穩定性。
此外,CARE技術還引入“救援機制”:即使多次嘗試均未得到正確結果,系統仍會從已有錯誤路徑中篩選出“相對最優解”,作為進一步學習的起點,使模型在復雜問題下仍能持續優化推理能力。

在實際效果上,該方法顯著提升了模型的解題質量。在MathVista(圖像數學推理)測試中,CARE準確率比傳統方法的68.9%高13.2個百分點,提升至82.1%;在MMMU-Pro(多學科綜合推理)測試中,CARE將準確率從36.4%提升至46.7%。整體來看,CARE 比傳統方法平均提升 4.6 個百分點。
目前,該技術已進入產品化階段,并逐步應用于傳音手機智能助手中。基于CARE優化后的能力,傳音手機智能助手拍照解題功能在輸出結果時不僅能夠提供答案,還能呈現更清晰、結構更完整的解題步驟,在面對多步驟推導問題時也更不容易出現邏輯中斷或錯誤累積。這種“過程可解釋”的能力,使AI從單純的解題工具,進一步向“可輔助理解”的學習工具演進。
拍照解題是傳音在 AI 教育應用上的重要方向。在非洲、南亞等地區,教育資源相對稀缺,部分家庭在課后輔導方面仍面臨一定困難。傳音推出的拍照解題功能為學生提供即時的解題思路與步驟解析,在一定程度上彌補學習支持資源的不足,幫助用戶更高效地理解知識點,提升學習效率,讓前沿科技真正服務于每個人的生活。
隨著AI技術持續向真實場景滲透,AI已經成為理解用戶需求、創造新體驗的重要工具。傳音積極將 AI 能力深度融入社交、出行、健康、教育等高頻場景,讓技術從“可用” 變為“真實可感”,實現用戶的體驗升級。此次聯合研究成果的落地,也為AI在教育場景中的進一步應用提供了新的技術路徑與實踐基礎。通過持續推進以用戶需求為導向的技術創新,并深化與高校的協同研發,傳音正不斷將前沿AI能力轉化為可落地的產品體驗,讓更多用戶能夠享受到AI帶來的便利。











