岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear科技資訊
手機版
二維碼
內容搜索
無障礙通道
語言：中文 EN

ITBear旗下自媒體矩陣：

滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

阿里千問團隊重磅開源Qwen3-ASR系列模型精準高效助力語音識別新突破

時間：2026-01-30 06:48:20 來源：ITBEAR編輯：快訊 IP：北京 發表評論無障礙通道

阿里千問團隊近日宣布，其自主研發的Qwen3-ASR系列語音識別模型正式開源。該系列包含兩款核心語音識別模型Qwen3-ASR-1.7B與Qwen3-ASR-0.6B，以及創新型語音強制對齊模型Qwen3-ForcedAligner-0.6B，形成覆蓋多語種、多場景的完整解決方案。此次開源不僅包含模型架構與權重參數，還同步推出配套推理框架，為學術界與產業界提供端到端的技術支持。

在技術架構層面，Qwen3-ASR系列依托自主研發的AuT語音編碼器與Qwen3-Omni多模態基座模型，實現語音識別性能的突破性提升。其中1.7B參數版本在中文、英文及混合口音場景中達到行業領先水平，特別是在噪聲干擾環境下仍能保持98%以上的識別準確率。0.6B參數版本則通過架構優化實現性能與效率的平衡，在128并發異步推理場景下可達到2000倍吞吐量，處理5小時音頻僅需10秒，滿足實時語音轉寫需求。

該系列模型支持全球52種語言及方言的識別，涵蓋30個語種的語音識別、22種中文方言及多國英語口音。在歌唱識別專項測試中，1.7B版本對帶背景音樂的中文歌曲轉寫錯誤率低至13.91%，英文歌曲達14.60%，顯著優于同類開源模型。針對兒童語音、低信噪比等復雜場景，模型通過自適應聲學建模技術，將字詞錯誤率控制在行業最低水平。

創新推出的Qwen3-ForcedAligner-0.6B強制對齊模型采用非自回歸推理架構，支持11種語言的任意語音片段時間戳標注。經權威測試，該模型在5分鐘以內音頻的時間戳預測精度超越WhisperX、NeMo等傳統方案，單并發推理延遲僅0.0089秒，可滿足影視字幕制作、語音教學等高精度需求場景。

配套開源的推理框架集成vLLM加速技術，支持流式/非流式混合推理、批量處理及時間戳預測等功能。開發者可通過HuggingFace、ModelScope等平臺直接調用模型資源，或基于阿里云百煉API快速構建語音識別服務。此次開源包含完整的模型訓練代碼與微調工具包，為語音技術社區提供可復現的研究基準。

更多>同類資訊

大曉機器人獲螞蟻集團等領投天使輪融資，加速具身智能技術落地應用

02-10

蘋果iOS 26.4或4月登場：Siri架構大升級，隱私優先邁向AI新階段

新版 Siri 的后端模型由蘋果與谷歌 Gemini 團隊聯合打造，這標志著蘋果在 AI 賽道上從純自研轉向了“自研 + 合作”的混合模式。蘋果軟件工程主管 Craig Federighi 透露，這種端到端…

02-10

從“看”到“玩”：Xmax AI用實時交互模型開啟視頻交互新紀元

當 AI 視頻還在卷時長與畫質時，Xmax AI 另辟蹊徑，用毫秒級延遲的實時交互模型X1，開啟了從「看視頻」到「玩視頻」的交互范式革命。不同于當前主流文生視頻模型聚焦影視內容生產與工業流程重構，X1 選…

02-10

字節Seedance 2.0實測：音畫配合出神入化，AI視頻創作門檻大降

而且啊，我這次生成的視頻也就相對長一點，但是你可以明顯注意到Seedance2.0對于開門這個動作的處理總是奇奇怪怪的，哪怕我把免費額度都用完了，但也沒有生成更好的效果，只得作罷。知名自媒體博主“影視颶…

02-10

OpenAI重獲增長動能：ChatGPT月活回升，本周將推新一代聊天模型

【環球網科技綜合報道】2月10日消息，據CNBC報道，面對競爭對手Anthropic在編碼工具領域的持續發力，OpenAI首席執行官薩姆·奧爾特曼（Sam Altman）近日向員工和投資者釋放積極信號，稱公…

02-10

Seedance 2.0爆火出圈：視頻生成突破背后，通往AGI之路還有多遠？

超越Sora尚在其次，更重要的是，物理世界的準確建模被視為通用AGI的關鍵能力之一，而Seedance2.0讓業內人士看到了實現這一點的可能性。目前來看，Seedance 2.0另一大爆火的原因，是創作…

02-10

達摩院RynnBrain模型開源：具身智能新突破 16項評測登頂力壓Gemini

為了克服這些問題，達摩院的RynnBrain模型創造性地引入了時空記憶和物理世界推理，這是機器人與環境互動所需的兩項基本能力。達摩院具身智能實驗室負責人趙德麗表示：“RynnBrain 首次實現了大腦對物…

02-10

全球首場機器人盛宴周日啟幕！百臺機器人共舞，解鎖科技藝術新想象

本場晚會將于2月8日晚上8點開場，智元旗下明星機器人“遠征A2”擔綱主理人，并特邀知名演員黃曉明、稚暉君、U航等嘉賓助陣，囊括了舞蹈、競技、時裝秀、唱歌、魔術、武術等多元形式的十二個精彩節目，從能文能武的硬核…

02-10

阿里達摩院RynnBrain開源：賦予機器人時空記憶，推動具身智能邁向新高度

RynnBrain首次讓機器人擁有時空記憶和空間推理能力，智能水平實現大幅躍升，在16項具身開源評測榜單上刷新紀錄（SOTA），超越谷歌GeminiRobotics ER 1.5等行業頂尖模型。達摩院具身…

02-10

AI社區新勢力：陳煒鵬攜Loopit亮相，欲打造互動內容新平臺

所以我覺得通用才是AI時代最大的確定性，這是我們做產品或者技術的principle。陳煒鵬：因為AI的Coding和多模態能力在不斷提升，尤其到了Nano Banana和Sora 2，我們覺得產品可以不只是…

02-10

谷歌Aluminum OS新動向：Gemini深度集成，Google鍵加空格輕松喚醒

IT之家 2 月 10 日消息，據科技媒體 9To5Google 昨天報道，谷歌的“安卓電腦”系統 Aluminum OS上月意外泄露，當時人們發現頂部的狀態欄上有 Gemini 圖標，不過最近的蛛絲馬跡進…

02-10

字節Seedance 2.0開啟內測限制真人素材防濫用探索AI發展平衡點

北京航空航天大學人工智能研究院教授沙磊評價稱，現在Seedance 2.0還在小范圍內測階段，字節也限制了一部分模型功能，比如只有在進行活體認證的情況下可以生成真人視頻，不支持輸入真人圖片或視頻做主體參考…

02-10

阿里達摩院發布RynnBrain并開源全系列模型助力機器人邁向通用具身智能新階段

02-10

大曉機器人獲天使輪融資，ACE范式引領具身智能開啟規?；涞匦缕?/a>

本輪募資金額將用于大曉機器人推進“以人為中心”的ACE具身全棧研發范式的技術迭代，加速環境式數據采集、開悟世界模型3.0（Kairos 3.0）的研發，推動具身超級大腦模組規模化落地，積極拓展能源、交通、文…

02-10

大曉機器人獲螞蟻集團領投天使輪融資加速具身智能研發與多場景落地

瑞財經吳文婷2月10日，大曉機器人已于近期完成天使輪融資。本輪融資由螞蟻集團領投，啟明創投、金景資本、弘毅投資、聯想創投、上海交大母基金菡源資產等機構跟投，老股東商湯國香資本持續增資。本輪募資金額將用于大…

02-10

點擊查看更多 +

全站最新

2月11日A股投資避雷針︱ST新華錦：資金占用整改期限臨近或面臨停牌風險

長城汽車“豪擲”建試驗室：智能交互與環境風洞助力汽車研發升級

阿里Qwen-Image 2.0來襲：文字渲染升級，圖像生成邁向生產力新階段

法拉利首款純電超跑“Luce”亮相喬納森·伊夫領銜設計重塑駕駛體驗

理想汽車新突破：全新L9馬赫100雙芯片有效算力遠超英偉達Thor U

資金動向 | 北水凈賣出騰訊14億，凈買入美團5.5億

熱門內容

本欄最新

阿里Qwen-Image 2.0來襲：文字渲染升級，圖像生成邁向生產力新階段

新款小米SU7上市在即：三種電池包可選，CLTC續航最高達902km

雷軍直播預熱！小米YU7 GT千匹馬力SUV亮相，紐北刷圈引熱議

科大訊飛兩款學習機對比：T30 Lite與LUMIE10 Pro，誰更適合孩子學習？

選對學習機，孩子學習更輕松——科大訊飛多款學習機深度評測與推薦

科大訊飛智能辦公本深度測評：五款熱銷機型對比，助你精準選對高效搭子

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

阿里千問團隊重磅開源Qwen3-ASR系列模型 精準高效助力語音識別新突破

阿里千問團隊重磅開源Qwen3-ASR系列模型精準高效助力語音識別新突破