當OpenClaw風暴席卷全球之時,無界方舟創始人曾曉東的反應不是興奮,而是一種“終于被看見”的感覺。
“OpenClaw本質上是一個Agent框架,底層是一個會寫代碼的Agent,放在云端服務器或者電腦上。”他對《智能涌現》說,“我們的AIOS本質上也是一個Agent框架,但它是放在硬件端側的OpenClaw——機器人、耳機、眼鏡,都可以在這套OS上運行。”
無界方舟從2024年成立起,就在做這件事。曾曉東給這套范式起了個名字:Vibe Hardware——用自然語言做硬件開發,AI就能自己寫程序、調驅動、完成整個應用研發與部署。
目前,無界方舟已經建立起了從硬件產品到OS的產品體系,包括AIOS“EVA”,以及包括AI教育機器人“奇多多AI學伴機”在內的硬件和產品生態。
近期,無界方舟也完成連續兩輪Pre-A輪融資。投資方包括全球知名穿戴式設備品牌韶音、國瑞源基金、恒松資本、上海天使會,易凱資本擔任獨家財務顧問。
過去一年內,無界方舟已經快速完成4輪融資,累計融資金額數億元。
△無界方舟創始人曾曉東
無界方舟創始人曾曉東曾在阿里巴巴及螞蟻集團任職10年,從0到1孵化了刷臉支付、支付寶盒(千萬級銷量)、淘咖啡(中國第一家無人超市)等硬件產品。
經歷過AI 1.0時代從做硬件層產品到系統的全過程,曾曉東說:“我認為潛力最大的是做內核本身,也就是OS。但要做內核不可能憑空想象,所以我需要先端到端做完一款硬件。”
無界方舟的目標,也并不是做單一的大模型公司或硬件公司,而是去打造一套面向新一代智能終端的AI操作系統(AIOS)框架,讓不同形態的設備都能在統一底座上運行、迭代。
“小龍蝦”時刻后,AI硬件開發范式已經改變
“小龍蝦”OpenClaw爆火后,Harness Engineering也成為硅谷熱議話題。
當模型能力越來越強,真正決定Agent好不好用的不再是模型本身,而是模型運行的環境:它能調用什么工具?它怎么理解當前狀態?反饋回路怎么設計?這套“環境”就是Harness。
EVA OS做的就是硬件領域的Harness Engineering。“可以理解為,EVA OS 就是硬件版本的Context Model,是給OS做加法,而不是替代。”曾曉東說。
他對《智能涌現》多次強調,EVA OS不是要做另一個鴻蒙。上一個傳統操作系統(Android、Linux、ROS)時代中,并不是AI能力不行,而是缺少一層——讓AI能力原生地跑在硬件上的中間層。
這個“中間層”到底需要做什么?
以前,調通一條完整的AI硬件鏈路并做到可服務,至少需要3個人、2-3個月的時間和成本。但安裝了EVA OS之后,開發者只用自然語言描述需求,AI知道自己所在硬件的環境,自己把APP寫出來。平均只需要半小時,就能讓端側變成一個可實時交互的AI,帶記憶,可以實時調整。
這種開發范式建立在EVA OS和硬件強耦合的基礎上。如果AI不了解它所在硬件的完整上下文——芯片算力多大、哪些傳感器在線、內存還剩多少、外設連接狀態如何——就不可能在上面研發任何APP。這是EVA OS最大的難點,也是核心壁壘。
近期,無界方舟就已經和一家機械手臂公司合作,將搭載EVA OS的開發板接上機械手臂后,AI先自己調通驅動、自己修Bug,然后開始自主探索。工程師發出指令“幫我拿起某個東西”,EVA OS就能夠自己寫程序、自己試錯。
“EVA OS可以自己試錯,是因為它知道開發板跟手臂之間的連接狀態。這跟以前完全不同。”曾曉東說。以前,工程師得自己看驅動文檔、排查各種硬件Bug,再一步步調通,讓硬件擺脫從前的傳統OS“預制APP+抽象硬件”的模式。
為了能夠在算力有限的端側跑通,EVA OS采取云端和本地協同的一種高效架構。EVA OS可以做到語音延遲小于250ms,多模態反饋小于350ms,這相較行業通用方案600ms左右的語音延遲提升非常多。
EVA OS的邏輯是,把能在硬件端側做完的事情留在本地,只把復雜推理丟給云端。語音識別、TTS、視覺感知這些高頻交互環節放在端側,而不需要每次通過云端計算。
端側模型則承擔記憶、執行和交互三層能力——記住用戶習慣、調用工具、提供交互界面;而云端保留通用知識和復雜推理,端側負責將這些能力變成硬件上真正能跑的東西。感知模型完全跑在端側,成本能降70%-92%。
△EVA OS的記憶能力,能夠回憶影像的關鍵畫面,回答相應問題,比如出現在視頻中的某個物件的位置
本輪融資后,無界方舟還將發布一款新硬件終端EVA Pi。曾曉東表示,這會是一臺“可以自主寫代碼、自主更新的硬件終端”。
△圖源:無界方舟
EVA Pi集成了EVA OS,能實時感知硬件側全部上下文(傳感器、驅動、鏈路狀態、運行反饋),在端側原生完成AI應用的開發、部署與迭代。
目前,EVA OS 1.0發布3個多月,已有超過2500家企業與研發單位將其應用于硬件產品研發,品類則覆蓋AI耳機、AI眼鏡、桌面機器人、智能腕帶、車載智能管家、機械手臂等多個品類,合作方包括全球知名的可穿戴設備和具身智能頭部企業。
模型端到端,決定了AIOS能否存在
和曾曉東的交流中,你會強烈感覺到他對端到端路線的堅持。
2024年上半年,大模型領域尚處在語言模型的風暴當中,多模態交互的技術路線尚未收斂。唯一的參照物是GPT-4o的發布會演示——但當時的OpenAI甚至還沒有開放API。
當時,絕大多數AI硬件公司都選擇走“串聯”路線——將ASR(語音識別)、大語言模型、TTS(語音合成)等模塊像流水線一樣接在一起,完成對應的任務。這條路線相對成熟、成本足夠經濟。“但問題也很明顯:模塊之間的信息損耗嚴重,比如情緒、語氣、連續性全部丟失,延遲層層疊加,會有很多修理的Bug。”曾曉東說。
他并沒有選擇這個方向,而是帶著7個人的團隊,經過近一年時間,推出了可以跑在硬件側的端到端多模態基座模型,這是EVA OS的基礎。
這源于曾曉東此前在螞蟻的多次“創業”經歷——孵化刷臉支付、支付寶盒、淘咖啡的過程中,反復撞上同一堵墻:AI算法和終端硬件之間,存在一條巨大的鴻溝,中間層嚴重缺位。
從無界方舟的選擇反推,本質是因為,未來的端到端模型一定要以更小的成本跑在各種端側設備上,這才是創業公司的機會。如果純做軟件側的垂類模型,太容易被基模廠商吞噬。
一個例子是,無界方舟從2024年開始,就已經通過“奇多多AI學伴機”探索AI教育方向;而做基模的巨頭們普遍在2024年下半年到2025年才入局AI+教育賽道,無界方舟就提早了半年到一年左右的窗口。
當前,無界方舟自研的端到端模型,用一個模型就同時處理語音識別、語音合成、視覺理解和語言推理,信息損耗大大減少。
自研端到端路線,首先是打開了更多硬件品類和場景。
“我們的一個端側模型,語音識別加TTS合在一起,一個模型完成兩個任務,不需要GPU,完全跑在CPU上,內存占用不超過1G。”曾曉東說。
在出海場景下,耳機、眼鏡等設備面對的海外網絡環境極不穩定,搭載EVA OS的硬件,能夠做到不需要聯網,就能完成語音識別、語音合成和基礎翻譯。
奇多多AI學伴機就是EVA OS的第一個落地案例——面向3-10歲兒童的AI教育機器人。
曾曉東把奇多多AI學伴機稱為EVA OS的硬件“樣板間”。目前,奇多多的用戶使用不算APP使用,僅計算AI對話、AI閱讀等硬件使用時長,當前奇多多AI學伴機的用戶日均使用高達145分鐘。
自研模型也會帶來交互體驗的差異化。這很大程度是因為端到端模型不經過各個模態間“翻譯”,語音和視覺信號直接關聯語言模型——它能感知情緒,能捕捉連續對話中的語境變化,回應因此更像一個真實的人。
成本優勢同樣關鍵。自研的端到端模型讓語音成本降至行業通用方案的二十分之一。所以,奇多多AI學伴機能夠做到千元級別售價,并且后續無訂閱費。
兩年前,曾曉東帶著七個人押注了硬件端到端這條沒有先例的路。兩年后,EVA OS已經迭代到了第三版,無界方舟正在孵化更多To C的硬件品類,和越來越多的品類合作——AI眼鏡和AI耳機等等。
模型的進化速度依舊遠超人們想象。不過,曾曉東說,更大的賭局才剛開始。
做AI硬件的操作系統,這條路并不新鮮。2017年前后,國內曾涌現過一批機器人OS創業公司,試圖像安卓一樣構建生態。成功者寥寥。天貓精靈和小米音箱靠補貼迅速占領入口,但它們定義的是“音箱”這一品類而非“智能體”,直接擠壓了垂直型OS的生存空間。
成本是更加致命的問題——當時追求高性能只能用手機級芯片,單顆成本高達幾百美金,即便終端賣到兩三千塊,公司依然在賠錢。
曾曉東認為,大模型時代的機會和AI 1.0時代有本質區別。“AI硬件的操作系統,現在全球還沒有一個真正意義上的贏家。窗口期可能就這兩三年。”
某種程度上,大模型重新定義了硬件的交互方式——內容不再需要預先灌裝,AI自己生成。低功耗AI芯片的成本降到了可商用的區間;端到端模型,則讓一個創業公司有可能用極小的團隊,把從模型到硬件的整條鏈路打通。“天時地利人和,上一波不具備的條件,這一波全齊了。”
現在,無界方舟內部已經全面Vibe Hardware,硬件迭代速度變成了每天一次。為了成為一家能把AIOS做出來的公司,曾曉東從去年開始推動一次組織變革——全員Vibe Coding,不論工程師、產品經理還是運營,所有人的工作都要匯集到代碼層面。
“當一家公司全員的所有動作都匯集到Vibe Coding,你所有的數據就結構化了。結構化之后,真正的中間層優化才有可能發生。”他說。













