滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

谷歌Gemini Embedding 2登場：全模態融合，開啟AI嵌入技術新篇章

時間：2026-03-11 22:24:19 來源：快訊編輯：快訊 IP：北京 發表評論無障礙通道

谷歌DeepMind近日宣布推出革命性產品Gemini Embedding 2，這款原生多模態嵌入模型實現了文本、圖像、視頻、音頻和文檔的統一嵌入處理，標志著人工智能技術在跨模態理解領域取得重大突破。該模型通過單一向量空間整合五種媒體形式，為開發者構建智能應用提供了全新范式。

技術架構方面，Gemini Embedding 2基于成熟的Gemini框架擴展開發，支持長達8192個token的文本輸入，可同時處理6張PNG/JPEG格式圖像，視頻處理能力覆蓋120秒內的MP4/MOV文件。特別值得關注的是其原生音頻處理能力，可直接將語音數據轉換為嵌入向量，省去了傳統語音轉文字的中間環節。文檔處理模塊則支持6頁以內的PDF文件直接嵌入，滿足企業級文檔分析需求。

該模型的創新性體現在多模態交錯處理機制上。開發者可在單次請求中混合輸入圖像、文本、視頻等不同類型數據，模型能夠自動捕捉跨模態間的語義關聯。例如在電商場景中，系統可同時理解商品圖片描述、用戶評價文本和產品演示視頻的深層含義，這種能力在傳統單模態模型中難以實現。

性能測試數據顯示，Gemini Embedding 2在文本、圖像、視頻三大核心任務的基準測試中均超越現有主流模型。谷歌特別強調其語音處理能力的突破性，通過端到端的音頻嵌入技術，該模型在語音搜索、會議紀要生成等場景展現出顯著優勢。測試表明，在相同精度要求下，其語音處理速度比傳統轉錄方案提升40%。

針對企業級應用場景，谷歌提供了靈活的向量維度配置方案。開發者可根據實際需求選擇3072、1536或768維輸出，在模型性能與存儲成本間取得平衡。這種設計對需要處理海量數據的推薦系統、智能客服等場景尤為重要，實測顯示768維配置可在保持92%精度的情況下，將存儲需求降低75%。

目前該模型已通過Gemini API和Vertex AI平臺開放預覽，首批合作伙伴正在醫療影像分析、多媒體內容檢索等領域展開應用測試。某國際科技企業利用其構建的跨模態檢索系統，將病歷圖像、檢查報告和診療錄音的聯合查詢效率提升了3倍。教育領域開發者則通過交錯輸入教材文本與配套視頻，實現了更精準的知識點關聯推薦。

技術實現層面，Gemini Embedding 2延續了Matryoshka表示學習（MRL）技術，通過動態維度壓縮機制實現向量精度的智能調整。這種"嵌套式"學習架構使模型在處理簡單任務時自動降低維度，復雜任務時釋放全部計算能力，有效優化了資源利用率。谷歌工程師透露，該技術使模型在移動端部署時的內存占用減少60%，同時保持95%以上的原始精度。

更多>同類資訊

Meta收購Moltbook：吸納AI人才探索“奇點”級AI代理社交新路徑

3月11日消息，據CNBC援引Axios報道稱，Meta證實已收購專為人工智能（AI）代理打造的病毒式社交媒體平臺Moltbook，旨在通過整合前沿技術，探索人工智能體（Agents）在服務個人與企業方面的全…

03-11

谷歌發布Gemini Embedding 2模型：支持多模態數據，簡化流程提升檢索精度

Gemini Embedding 2 則支持文本、圖像、視頻、音頻和文檔，并能在 100 種語言中識別語義意圖。文本：上下文窗口最高8192tokens 圖像：每次請求最多 6 張，支持 PNG 和 J…

03-11

OpenAI整合Sora入ChatGPT：激活用戶增長，應對谷歌Gemini競爭挑戰

OpenAI正計劃將旗下視頻生成AI工具Sora整合進ChatGPT，此舉標志著該公司在產品策略上的重要轉向。OpenAI于2024年2月首次預覽這一視頻生成AI，同年12月在獨立網站正式向公眾開放，并于去年…

03-11

OpenClaw“龍蝦”爆火背后：技術躍遷下的受益者與普通人的距離

OpenClaw爆火，更關鍵的是，它做對了一件事——降低了部署Agent的心理門檻，即使技術門檻并沒有真正降低。也就是說，OpenClaw雖然看起來降低了部署的心理門檻，但對普通用戶而言，它仍然是一款典型…

03-11

從滯銷到脫銷：Mac mini因AI“龍蝦”逆襲，狂歡背后安全隱憂待解

當“養龍蝦”成為新潮流，Mac mini從邊緣產品躍升為“AI神器”，這場由技術狂歡點燃的市場異動，既照見了開源智能的潛力，也暴露了普通用戶面對新技術時的認知盲區與安全風險。更關鍵的是，用戶不愿將高權限智能體…

03-11

谷歌Gemini Embedding 2登場：全模態融合，開啟AI嵌入技術新篇章

3月10日，谷歌DeepMind推出Gemini Embedding2，這是該公司首個原生多模態嵌入模型，將文本、圖像、視頻、音頻及文檔統一映射至單一嵌入空間，標志著AI嵌入技術邁入全模態融合的新階段。 G…

03-11

電商平臺包郵到港：香港民眾享內地物價，高收入低網購成本成新選擇

還有香港網友在社交平臺表示，香港本地的飲料售價偏高，一瓶礦泉水售價七八塊，可樂十多塊，而在拼多多購買飲料不僅可享受不限重量的包郵到港服務，商品價格還與內地保持一致。不過香港民眾雖能通過電商平臺網購節省購物…

03-11

AWE 2026京東展臺亮點搶先看：60余款智能機器人齊聚多款獨家新品首發

據介紹，京東將首次攜手宇樹科技、眾擎、云深處、元點智能、鏡識科技等多家全球頂尖機器人品牌亮相AWE，帶來一場涵蓋新品首發、場景表演、大咖分享與直播互動的智能科技全景秀。同時，京東還攜手眾多機器人品牌，集結…

03-11

海淀“AI數據工廠”崛起：光輪智能領跑，為機器人產業變革注入新動力

光輪智能打造了全球首個工業級仿真評測平臺RoboFinals，像一個“機器人奧運會”，能客觀評估不同機器人的真實能力，正在成為行業標準。光輪智能在仿真合成數據、仿真評測與人類視頻數據三個維度均摘得全球交付冠軍…

03-11

禾賽科技ATX煥新版激光雷達獲北汽多款車型定點，2026年量產交付訂單超400萬臺

03-11

愛奇藝，陷入“降本增效”死循環

03-11

雷軍這次真把車險價格打下來了！小米官方車險在北京上線

03-11

Meta收購OpenClaw專屬社交網絡Moltbook

03-11

OpenAI視頻生成工具Sora將登陸ChatGPT

03-11

抖音公告：無限期封禁

03-11

點擊查看更多 +

全站最新

坦克700 Hi4-Z內飾官圖亮相！雙拼色座椅配吸頂屏純電續航190km

伊朗稱完全有能力封鎖霍爾木茲海峽

“龍蝦熱”到“卸載慌”？OpenClaw概念大跳水

龍虎榜 | 寧波桑田路清倉華勝天成超2.2億，佛山系掃貨寧波建工超1.5億

資金動向 | 北水大肆拋騰訊超24億港元，連續3日加倉阿里

注意！新房卷到了極致

熱門內容

本欄最新

電商平臺包郵到港：香港民眾享內地物價，高收入低網購成本成新選擇

AWE 2026京東展臺亮點搶先看：60余款智能機器人齊聚多款獨家新品首發

海淀“AI數據工廠”崛起：光輪智能領跑，為機器人產業變革注入新動力

實體生意困局：傳統模式失效，線上引流線下承接成破局之道

小米YU7連續6月登頂中大型SUV銷冠上市半年交付破20萬臺

雷軍透露小米YU7 2月銷量亮眼：躋身全國乘用車前三，1月銷量也超3.7萬

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

谷歌Gemini Embedding 2登場：全模態融合，開啟AI嵌入技術新篇章