滾動資訊

當前位置：首頁 > 資訊 > 業(yè)界動態(tài) > 正文內(nèi)容

谷歌Gemini Embedding2模型登場：跨媒體理解新突破，助力AI讀懂多元世界

時間：2026-03-11 17:13:10 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評論無障礙通道

谷歌近日宣布推出全新Gemini Embedding2模型，這款模型作為谷歌首個原生多模態(tài)嵌入解決方案，突破了傳統(tǒng)技術(shù)對單一數(shù)據(jù)類型的限制。通過將文本、圖像、視頻、音頻及文檔統(tǒng)一映射至高維數(shù)學(xué)空間，該模型實現(xiàn)了跨媒體內(nèi)容的深度語義關(guān)聯(lián)，為人工智能理解復(fù)雜信息提供了全新路徑。

與生成式模型不同，Gemini Embedding2專注于構(gòu)建機器可理解的語義表征。其核心機制是將不同模態(tài)的數(shù)據(jù)轉(zhuǎn)化為標準化向量，使系統(tǒng)能夠捕捉到"蘋果"在文字描述、產(chǎn)品圖片、種植視頻中的共同語義特征。這種處理方式相比傳統(tǒng)關(guān)鍵詞匹配，在上下文關(guān)聯(lián)準確度上提升了40%以上，尤其在處理多義詞和隱喻表達時表現(xiàn)突出。

該模型的技術(shù)架構(gòu)呈現(xiàn)三大創(chuàng)新：支持PNG/JPEG圖像、120秒MP4/MOV視頻、原生音頻及6頁PDF文檔的直接處理；覆蓋100種語言的語義理解能力；允許單次請求中組合輸入圖像+文本、視頻+音頻等多模態(tài)數(shù)據(jù)。這種設(shè)計使得模型能夠分析新聞配圖與正文的關(guān)系，或識別產(chǎn)品演示視頻中的關(guān)鍵操作步驟。

在法律取證場景中，Gemini Embedding2展現(xiàn)出顯著優(yōu)勢。某試點項目顯示，該模型可在300萬條跨媒體記錄中，用12秒定位到包含特定合同條款的郵件附件、相關(guān)會議錄音及簽署視頻。這種效率源于其多維度聯(lián)合分析機制，能夠同時解析文本中的法律術(shù)語、視頻中的手勢動作及音頻中的語氣特征。

開發(fā)者可通過Gemini API和Vertex AI平臺調(diào)用該模型，快速構(gòu)建具備跨媒體理解能力的應(yīng)用。某醫(yī)療團隊已利用其開發(fā)診斷輔助系統(tǒng)，該系統(tǒng)能同步分析患者描述、檢查報告圖片及歷史問診錄音，生成更精準的診療建議。這種能力標志著人工智能從單一數(shù)據(jù)解析向綜合信息理解的重要跨越。

目前模型已開放預(yù)覽版本，支持每分鐘1000次的調(diào)用頻率。谷歌工程師透露，后續(xù)版本將增加對3D模型、AR/VR數(shù)據(jù)的處理能力，并優(yōu)化長視頻的語義分割精度。這項技術(shù)突破正在重塑信息檢索、內(nèi)容推薦及知識圖譜構(gòu)建等領(lǐng)域的技術(shù)標準。

03-11

沃爾瑪“山姆化”轉(zhuǎn)型：成效初顯，未來平衡與突破之路在哪？

03-11

銅師傅通過港交所聆訊：傳統(tǒng)工藝邂逅現(xiàn)代設(shè)計，銅質(zhì)文創(chuàng)龍頭市占率達35%

03-11

Meta收購Moltbook布局AI社交領(lǐng)域創(chuàng)始人將入職超智能實驗室開啟新篇章

03-11

百度智能云DuClaw上線：零部署網(wǎng)頁即用，多模型切換助力“零門檻?zhàn)B蝦”

03-11

京東再添新成員！北京京東金航貿(mào)易有限公司成立注冊資本10萬

03-11

扎克伯格曬與亞歷山大·王親密照，以行動擊碎職場不和傳言

03-11

OpenAI賦能ChatGPT：動態(tài)可視化功能上線，讓數(shù)理化學(xué)習(xí)更直觀高效

03-11

《黑袍糾察隊》VR新游《觸發(fā)警告》實機預(yù)告來襲 3月26日開啟復(fù)仇之旅

03-11

特斯拉Cybercab測試與產(chǎn)能雙提速，規(guī)模化量產(chǎn)或指日可待

03-11

螞蟻集團2026春招開啟：超七成崗位聚焦AI，全球多城招賢納士

瑞財經(jīng) 王敏 3月10日，阿里巴巴(09988.HK)旗下螞蟻集團正式啟動2026春季校園招聘。公告顯示，螞蟻集團本次春招技術(shù)類崗位占比達85%，其中逾70%的崗位與人工智能直接相關(guān)，重點聚焦大模型算法、多…

03-11

口袋里的攝影機！韓伯嘯詳解vivo X300 Ultra視頻能力細節(jié)

03-11

周意保曬OPPO Find N6路人盲測視頻：折痕控制無比驚艷

03-11

受AI及裁員等因素影響，2月美國科技從業(yè)者信心再度下滑

03-11

活躍度呈現(xiàn)下滑趨勢后，消息稱OpenAI視頻生成工具Sora將登陸ChatGPT

03-11

點擊查看更多 +

全站最新

螞蟻集團2026春招開啟：超七成崗位聚焦AI，全球多城招賢納士

能源焦慮席卷全球！“風光儲”ETF狂飆

A股煤炭股走高，中煤能源漲超6%

港股異動丨健康160飆升超25%，創(chuàng)上市新高，營運系統(tǒng)引入OpenClaw

日股收漲1.43%

韓股收漲1.4%

熱門內(nèi)容

本欄最新

沃爾瑪“山姆化”轉(zhuǎn)型：成效初顯，未來平衡與突破之路在哪？

銅師傅通過港交所聆訊：傳統(tǒng)工藝邂逅現(xiàn)代設(shè)計，銅質(zhì)文創(chuàng)龍頭市占率達35%

Meta收購Moltbook布局AI社交領(lǐng)域創(chuàng)始人將入職超智能實驗室開啟新篇章

百度智能云DuClaw上線：零部署網(wǎng)頁即用，多模型切換助力“零門檻?zhàn)B蝦”

特斯拉Cybercab測試與產(chǎn)能雙提速，規(guī)模化量產(chǎn)或指日可待

螞蟻集團2026春招開啟：超七成崗位聚焦AI，全球多城招賢納士

本網(wǎng)站LOGO小熊標志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

谷歌Gemini Embedding2模型登場：跨媒體理解新突破，助力AI讀懂多元世界