谷歌近日悄然推出一款名為Google AI Edge Eloquent的語(yǔ)音轉(zhuǎn)寫(xiě)應(yīng)用,現(xiàn)已登陸iOS平臺(tái)。這款工具以離線處理能力為核心賣(mài)點(diǎn),用戶下載專用模型后即可在設(shè)備端完成語(yǔ)音輸入與文本轉(zhuǎn)換,無(wú)需依賴網(wǎng)絡(luò)連接。其技術(shù)基礎(chǔ)源自谷歌Gemma系列自動(dòng)語(yǔ)音識(shí)別模型,能夠?qū)崟r(shí)將用戶語(yǔ)音轉(zhuǎn)化為文字并顯示在屏幕上。
針對(duì)口語(yǔ)表達(dá)特點(diǎn),該應(yīng)用開(kāi)發(fā)了智能優(yōu)化功能。當(dāng)用戶暫停錄音時(shí),系統(tǒng)會(huì)自動(dòng)過(guò)濾"嗯""啊"等填充詞,并對(duì)文本進(jìn)行邏輯梳理,使輸出內(nèi)容更符合書(shū)面表達(dá)習(xí)慣。轉(zhuǎn)寫(xiě)完成后,用戶可通過(guò)四種預(yù)設(shè)模式快速調(diào)整文本風(fēng)格:要點(diǎn)模式提煉核心信息,正式模式優(yōu)化語(yǔ)言規(guī)范,簡(jiǎn)短模式壓縮內(nèi)容長(zhǎng)度,擴(kuò)展模式補(bǔ)充細(xì)節(jié)描述。
在數(shù)據(jù)處理方式上,應(yīng)用提供雙重選擇。本地模式完全在設(shè)備端完成所有計(jì)算,確保隱私安全;云端模式則調(diào)用Gemini模型進(jìn)行深度潤(rùn)色,提升文本質(zhì)量。為提高識(shí)別準(zhǔn)確率,用戶可導(dǎo)入Gmail聯(lián)系人姓名、專業(yè)術(shù)語(yǔ)等個(gè)性化詞匯庫(kù),也支持手動(dòng)添加自定義詞匯。
歷史記錄管理功能是該應(yīng)用的另一亮點(diǎn)。系統(tǒng)會(huì)自動(dòng)保存所有轉(zhuǎn)寫(xiě)內(nèi)容,并支持關(guān)鍵詞搜索。用戶可查看每條記錄的語(yǔ)速統(tǒng)計(jì)(每分鐘詞數(shù))和總字?jǐn)?shù),便于進(jìn)行效率分析。這些數(shù)據(jù)存儲(chǔ)在設(shè)備本地,進(jìn)一步保障了用戶隱私。
目前僅iOS用戶可體驗(yàn)這款應(yīng)用,但開(kāi)發(fā)團(tuán)隊(duì)透露Android版本正在籌備中。預(yù)計(jì)在安卓系統(tǒng)上,該工具將深度集成輸入功能,通過(guò)懸浮按鈕實(shí)現(xiàn)全局語(yǔ)音轉(zhuǎn)寫(xiě)調(diào)用,為用戶提供更便捷的操作體驗(yàn)。這一跨平臺(tái)布局顯示出谷歌在語(yǔ)音交互領(lǐng)域的持續(xù)投入。








