近日,一家專(zhuān)注于端側(cè)AI模型研發(fā)的北京企業(yè)面壁智能,正式開(kāi)源了其最新成果——MiniCPM-o 4.5模型。這款僅有90億參數(shù)的模型,憑借高密度架構(gòu)與全模態(tài)交互能力,在行業(yè)內(nèi)引發(fā)廣泛關(guān)注。其核心創(chuàng)新在于實(shí)現(xiàn)了“全雙工交互”技術(shù),使模型能夠像人類(lèi)一樣邊感知環(huán)境邊主動(dòng)回應(yīng),為具身智能設(shè)備提供了更智能的“大腦”解決方案。
與傳統(tǒng)大模型不同,面壁智能從創(chuàng)業(yè)初期就聚焦端側(cè)場(chǎng)景。此次發(fā)布的MiniCPM-o 4.5,參數(shù)規(guī)模僅為行業(yè)頭部模型的1.34%至3.83%,卻集成了視覺(jué)理解、文檔解析、語(yǔ)音交互、聲音克隆等全模態(tài)能力。據(jù)研發(fā)團(tuán)隊(duì)介紹,該模型突破了傳統(tǒng)單工交互的局限,通過(guò)全雙工技術(shù)實(shí)現(xiàn)了“邊看、邊聽(tīng)、主動(dòng)說(shuō)”的實(shí)時(shí)響應(yīng)能力。例如在視覺(jué)場(chǎng)景中,模型可根據(jù)畫(huà)面變化自主判斷交互時(shí)機(jī),無(wú)需等待用戶指令即可輸出信息,大幅降低了對(duì)話延遲。
技術(shù)負(fù)責(zé)人姚遠(yuǎn)用對(duì)講機(jī)與電話的比喻解釋技術(shù)差異:“傳統(tǒng)模型如同對(duì)講機(jī),說(shuō)話時(shí)無(wú)法接收信息,而全雙工模型則像電話,實(shí)現(xiàn)了輸入輸出的并行處理。”這種能力在具身機(jī)器人領(lǐng)域具有顛覆性意義。當(dāng)前行業(yè)多聚焦運(yùn)動(dòng)控制與視覺(jué)-語(yǔ)言-動(dòng)作(VLA)模型,但缺乏環(huán)境感知與主動(dòng)交互能力。MiniCPM-o 4.5的加入,有望補(bǔ)齊機(jī)器人“理解-溝通-響應(yīng)”的關(guān)鍵能力鏈。
公司CEO李大海將該模型視為技術(shù)范式升級(jí)的標(biāo)志性產(chǎn)品。他指出,現(xiàn)有智能設(shè)備多為被動(dòng)響應(yīng)模式,而具備環(huán)境感知能力的主動(dòng)式智能將催生全新應(yīng)用場(chǎng)景。以汽車(chē)為例,搭載該模型的車(chē)輛可實(shí)時(shí)理解駕駛員狀態(tài)與路況變化,提供更精準(zhǔn)的交互服務(wù)。這種轉(zhuǎn)變不僅需要模型具備多模態(tài)處理能力,更要求在算力受限的端側(cè)設(shè)備上實(shí)現(xiàn)高效運(yùn)行。
支撐這種技術(shù)突破的,是面壁智能獨(dú)創(chuàng)的“密度法則”。該理論由首席科學(xué)家劉知遠(yuǎn)提出,核心觀點(diǎn)是模型能力密度每100天就會(huì)翻倍增長(zhǎng)。基于此,團(tuán)隊(duì)通過(guò)持續(xù)優(yōu)化算法架構(gòu),在極小參數(shù)規(guī)模下實(shí)現(xiàn)了性能躍升。李大海形象地將這種技術(shù)路線比作“大模型的光刻機(jī)”:“就像芯片制造追求晶體管密度,我們致力于在有限算力下壓縮更多智能。”
在商業(yè)化落地方面,面壁智能已與多家車(chē)企達(dá)成合作。聯(lián)合創(chuàng)始人雷升濤透露,團(tuán)隊(duì)曾將車(chē)載遺留物品提醒功能的響應(yīng)時(shí)間從4秒壓縮至1秒以內(nèi),這種極致優(yōu)化正是端側(cè)模型的核心競(jìng)爭(zhēng)力。他強(qiáng)調(diào),端側(cè)場(chǎng)景對(duì)算力、內(nèi)存的嚴(yán)苛約束,反而成為推動(dòng)技術(shù)突破的動(dòng)力源。當(dāng)前模型已在汽車(chē)、手機(jī)等終端設(shè)備上實(shí)現(xiàn)穩(wěn)定運(yùn)行,驗(yàn)證了技術(shù)路線的可行性。
對(duì)于AI技術(shù)演進(jìn)方向,劉知遠(yuǎn)認(rèn)為將呈現(xiàn)兩大趨勢(shì):一是專(zhuān)業(yè)能力持續(xù)強(qiáng)化,智能體將具備自主探索與跨領(lǐng)域協(xié)作能力;二是模型密度不斷提升,最終實(shí)現(xiàn)終端設(shè)備的普惠化部署。他預(yù)測(cè),未來(lái)三到五年內(nèi),個(gè)人專(zhuān)屬模型將成為現(xiàn)實(shí),這些具備自主學(xué)習(xí)能力的智能體將深度融入日常生活,成為真正的個(gè)性化助手。










