在直播行業蓬勃發展的當下,1.8億實名開播賬號與3880萬名職業主播的規模背后,是千億級終端需求的明確市場。然而,行業長期面臨“手機直播畫質不足、PC專業直播操作復雜且成本高昂”的雙重困境。針對這一痛點,科技企業易思態(EastAI)憑借五年軟硬一體技術研發積累,推出以“All-in-One硬件+AI專業導播+SaaS增值服務”為核心的三位一體解決方案,聯合阿里云千問系列大模型能力,打造AI直播一體機及多品類智能終端,為直播、會議、教育等場景提供高效智能的技術支撐。
作為端側AI技術創新的先行者,易思態的技術覆蓋操作系統改造、音視頻處理、模型端側部署等關鍵領域。經過1800余天研發、17套平臺方案優化、32次固件迭代,并通過3000余家硬件付費客戶的驗證,其首款量產產品P9 Max直播一體機正式落地。該設備在硬件層面搭載索尼IMX766大底傳感器,配備5000萬像素全像素全向對焦技術,從底層重構影像、音頻、顯示三大系統,直播畫質可媲美蘋果前置攝像頭。接口方面,支持HDMI IN/OUT、USB3.0、全功能Type-C等全協議覆蓋,兼容微單、無人機等專業設備,無需外設即可搭建復雜直播間。
軟件體驗上,全自研iDaobo智能導播系統將專業功能簡化至“一屏操作”:美顏、機位切換、調音等核心功能三步完成,零基礎用戶1分鐘即可開播。其背后依托阿里云視頻大模型萬相的深度賦能:AI提詞器通過FunASR端側ASR技術實現“字隨音走”,解決主播忘詞難題;直播間背景視頻借助萬相模型自動生成首尾幀銜接循環,無需專業團隊即可打造沉浸式動態場景。翻譯功能支持跨境直播的雙向同傳,實現“主播說中文、觀眾聽英文、彈幕雙語同步”,打破跨文化交流壁壘。
在生態構建方面,易思態以“技術落地+生態共建”為理念,將端側AI音視頻技術延伸至會議、通話等場景。在阿里云通義智能硬件展上,其通過實景AI直播間展示技術實力:P9 Max與阿里云無影數字人方案深度兼容,生態伙伴可快速落地數字人直播服務,覆蓋虛擬主播生成、多語種播報、實時互動等全流程。目前,已有企業借助該方案推出數字人直播一體機,應用于電商帶貨、本地生活等領域,顯著降低運營成本。
針對開發者合作,易思態提供“零開發接入”“淺層適配(3天上線)”“深度整合”三種模式,開放千問系列大模型技術能力。例如,品牌客戶“必火智能”通過即插即用模式接入后,服務的本地生活商家月均曝光量提升超30萬;數字人企業“開飛秒創”經淺層適配后,3天內完成多平臺數據對接,實現場景全覆蓋。在AI直播托管場景中,生態伙伴集成百聆大模型語義理解與TTS技術,實現直播內容自動生成、主播聲音定制化播報,推動“無人值守直播”精準觸達目標用戶。
易思態聯合合作伙伴推出雙向同聲傳譯耳機、雙屏翻譯機、同傳手機等創新產品。耳機通過藍牙協議改造支持全場景雙向同傳;雙屏翻譯機采用Gummy+Qwen-mt-plus雙模型,適配酒店、展會等場景的實時對話需求;同傳手機兼容所有通話、社交、會議類APP,全面支持遠程溝通。這些產品均深度融合千問系列大模型能力,推動AI音頻應用融入日常生態。
目前,易思態已形成toB與toC并行的商業模式:面向企業提供“PCBA+License”、純License、整機貼牌等服務,通過“硬件為基、軟件為魂、生態為翼”的發展格局,持續推動端側AI音視頻技術落地,助力產業升級與生活便利化。











