科技巨頭谷歌近日在應(yīng)用市場(chǎng)推出了一款名為"Google AI Edge Eloquent"的語(yǔ)音轉(zhuǎn)寫工具,目前僅面向iOS用戶開放下載。這款以本地化處理為核心的應(yīng)用,通過搭載自主研發(fā)的Gemma語(yǔ)音識(shí)別模型,實(shí)現(xiàn)了無需聯(lián)網(wǎng)即可完成高精度轉(zhuǎn)錄的功能,直接對(duì)標(biāo)Wispr Flow、SuperWhisper等同類產(chǎn)品。
應(yīng)用界面設(shè)計(jì)簡(jiǎn)潔直觀,用戶啟動(dòng)后即可實(shí)時(shí)查看語(yǔ)音轉(zhuǎn)寫內(nèi)容。系統(tǒng)內(nèi)置的智能編輯功能可自動(dòng)識(shí)別并刪除"嗯""啊"等填充詞,同時(shí)對(duì)文本進(jìn)行語(yǔ)法優(yōu)化。針對(duì)不同使用場(chǎng)景,用戶可通過"要點(diǎn)""正式""簡(jiǎn)短""詳細(xì)"四種預(yù)設(shè)模式快速調(diào)整輸出格式,滿足會(huì)議記錄、采訪速記等多樣化需求。
在個(gè)性化設(shè)置方面,該應(yīng)用支持與Gmail賬戶深度聯(lián)動(dòng),可自動(dòng)提取聯(lián)系人姓名、專業(yè)術(shù)語(yǔ)等關(guān)鍵信息構(gòu)建專屬詞庫(kù)。用戶還能手動(dòng)添加行業(yè)術(shù)語(yǔ)、產(chǎn)品名稱等自定義詞匯,確保轉(zhuǎn)寫內(nèi)容的專業(yè)準(zhǔn)確性。歷史記錄模塊不僅提供全文檢索功能,還會(huì)統(tǒng)計(jì)每次轉(zhuǎn)寫的詞匯量、語(yǔ)速等數(shù)據(jù),幫助用戶分析使用習(xí)慣。
技術(shù)架構(gòu)上,Eloquent采用雙模式運(yùn)行機(jī)制。默認(rèn)狀態(tài)下使用本地Gemma模型處理數(shù)據(jù),確保隱私安全;開啟云模式后,則調(diào)用更強(qiáng)大的Gemini模型進(jìn)行深度優(yōu)化,特別適合處理復(fù)雜句式或?qū)I(yè)內(nèi)容。兩種模式間的切換無需重啟應(yīng)用,極大提升了使用流暢度。
根據(jù)App Store頁(yè)面信息,Android版本正在開發(fā)中,未來將實(shí)現(xiàn)系統(tǒng)級(jí)深度集成。用戶可將其設(shè)為默認(rèn)鍵盤,在任意文本輸入框通過懸浮按鈕快速調(diào)用轉(zhuǎn)寫功能。這種設(shè)計(jì)思路與Wispr Flow在安卓端的實(shí)現(xiàn)方式形成直接競(jìng)爭(zhēng),預(yù)示著移動(dòng)端語(yǔ)音輸入市場(chǎng)將迎來新一輪變革。
谷歌官方描述強(qiáng)調(diào),這款實(shí)驗(yàn)性產(chǎn)品旨在解決傳統(tǒng)轉(zhuǎn)寫工具"逐字記錄卻忽視語(yǔ)義"的痛點(diǎn)。通過AI算法理解上下文關(guān)系,應(yīng)用能夠智能處理口語(yǔ)中的重復(fù)修正、語(yǔ)義轉(zhuǎn)折等情況,輸出更符合書面表達(dá)習(xí)慣的文本。這種技術(shù)突破或?qū)⒅匦露x語(yǔ)音轉(zhuǎn)寫的行業(yè)標(biāo)準(zhǔn)。
當(dāng)前市場(chǎng)研究顯示,隨著遠(yuǎn)程辦公和移動(dòng)創(chuàng)作的普及,語(yǔ)音轉(zhuǎn)寫工具的用戶規(guī)模持續(xù)擴(kuò)大。谷歌此時(shí)入局不僅展現(xiàn)了其在AI語(yǔ)音領(lǐng)域的技術(shù)積累,更通過跨平臺(tái)戰(zhàn)略試圖占據(jù)市場(chǎng)先機(jī)。iOS版本的測(cè)試反饋將成為Android版開發(fā)的重要參考,其最終表現(xiàn)值得持續(xù)關(guān)注。











