科技巨頭谷歌近日在iOS平臺悄然推出一款名為"Google AI Edge Eloquent"的語音轉寫應用,標志著其正式加入AI驅動的實時轉錄市場競爭。這款以本地化處理為核心的應用,通過集成自主研發的Gemma語音識別模型,為用戶提供從日常對話到專業場景的多樣化轉錄服務。
應用最顯著的特點在于其智能文本處理能力。當用戶完成語音輸入后,系統不僅能實時顯示轉錄內容,更可自動識別并過濾"嗯"、"啊"等口語化填充詞,同時對文本進行語法優化。針對不同使用場景,用戶可通過底部菜單欄快速切換"要點提煉"、"正式文稿"、"簡短摘要"和"詳細記錄"四種文本格式,滿足會議紀要、采訪記錄等多元需求。
在數據處理模式上,該應用提供靈活的云端-本地雙方案。默認狀態下,基礎轉錄由設備端Gemma模型完成,確保離線可用性;開啟云模式后,系統將調用更強大的Gemini模型進行二次優化,提升復雜句式和專有名詞的識別準確率。這種設計既保障了基礎功能的獨立性,又為追求極致體驗的用戶提供升級選項。
個性化功能成為產品亮點。通過深度集成Gmail賬戶,應用可自動提取用戶常用聯系人、專業術語及行業關鍵詞構建專屬詞典,同時支持手動添加自定義詞匯。轉錄歷史界面不僅顯示詞匯統計數據,更配備智能搜索功能,用戶可通過關鍵詞快速定位過往記錄,提升信息檢索效率。
雖然當前版本僅限iOS設備使用,但谷歌在應用商店描述中明確透露Android版本開發計劃。據披露,安卓版將實現系統級深度整合,用戶可將其設為默認鍵盤,在任意輸入框通過懸浮按鈕啟動轉錄功能。這種設計思路與競品Wispr Flow的懸浮窗模式形成直接競爭,預示著移動端語音輸入生態將迎來新一輪變革。
市場分析指出,隨著遠程辦公和內容創作需求激增,AI轉錄工具正從輔助性功能轉變為生產力剛需。谷歌此次入局不僅帶來技術層面的創新,更通過跨平臺戰略試圖重構市場格局。其能否憑借強大的模型研發能力和生態整合優勢后來居上,將成為行業觀察的重要焦點。













