滾動資訊

當前位置：首頁 > 資訊 > 業(yè)界動態(tài) > 正文內(nèi)容

谷歌Gemini安卓測試版升級：雙模態(tài)交互助力AI圖像編輯邁向?qū)I(yè)化

時間：2026-03-18 17:07:36 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評論無障礙通道

谷歌近期在Gemini安卓應(yīng)用的測試版本中，推出了一項針對生成式圖像編輯的突破性功能升級。此次更新聚焦于解決AI圖像二次創(chuàng)作中的兩大難題：指令傳達模糊與操作流程割裂，通過深度整合標記界面與實時文本輸入框，顯著提升了用戶對生成內(nèi)容（如示例中的“Nano Banana”圖像）的局部調(diào)整能力。

新版本的核心創(chuàng)新在于交互模式的徹底重構(gòu)。過去，用戶需先在圖像上簡單涂鴉標記修改區(qū)域，再退出編輯界面通過對話形式向AI傳達指令，流程繁瑣且精度有限。如今，用戶只需點擊“鉛筆”圖標，即可直接在圖像特定位置進行高精度標記，同時在下方新增的文本框中輸入修改需求，實現(xiàn)“視覺定位+自然語言”的雙通道指令輸入。這種設(shè)計使模型對局部修改意圖的理解準確率大幅提升，例如將“讓香蕉彎曲度增加30%”或“調(diào)整背景色為暖色調(diào)”等復雜需求轉(zhuǎn)化為可執(zhí)行的參數(shù)。

技術(shù)層面，谷歌通過優(yōu)化多模態(tài)感知算法，使標記工具與文本描述形成動態(tài)關(guān)聯(lián)。當用戶在圖像上標記區(qū)域時，系統(tǒng)會自動分析該區(qū)域的色彩、形狀等特征，并在文本框中生成建議性描述模板，降低用戶輸入門檻。測試版還預留了“調(diào)整大小”和“特效應(yīng)用”等擴展功能接口，暗示未來可能集成裁剪、濾鏡、光影調(diào)整等全流程編輯能力，推動Gemini從單一文生圖工具向綜合性數(shù)字創(chuàng)作平臺進化。

行業(yè)分析師指出，這一升級反映了生成式AI領(lǐng)域的競爭焦點正從“內(nèi)容生成”轉(zhuǎn)向“精準控制”。谷歌選擇在移動端原生應(yīng)用中嵌入專業(yè)級標記工具，旨在搶占移動AI創(chuàng)作市場的制高點。通過降低精細化編輯的技術(shù)門檻，普通用戶無需掌握專業(yè)軟件即可實現(xiàn)接近設(shè)計師水平的圖像調(diào)整，而專業(yè)創(chuàng)作者則能借助AI加速創(chuàng)意落地。

目前，該功能仍處于內(nèi)部測試階段，尚未對公眾開放。但從代碼分析來看，其“即標即改”的實時反饋機制已具備商業(yè)化潛力。例如，用戶標記圖像中的人物面部后，輸入“消除皺紋并提亮膚色”，系統(tǒng)可在3秒內(nèi)生成符合描述的修改版本。這種效率若能延續(xù)至正式版本，將極大縮短AI繪畫從概念到成品的周期，推動其從娛樂應(yīng)用向商業(yè)設(shè)計、內(nèi)容生產(chǎn)等場景滲透。

03-18

三星Galaxy Glasses攜Gemini AI來襲，構(gòu)建AI穿戴生態(tài)，重塑數(shù)字交互體驗

03-18

楊植麟GTC首談大模型進化：Token效率、長上下文與Agent集群三維破局

03-18

百度移動生態(tài)“模型化”重塑：大模型悍將入駐，搜推融合與AI延伸雙提速

03-18

AI科技引領(lǐng)家電變革，“無人家務(wù)”時代加速到來，生活品質(zhì)再升級

石頭科技產(chǎn)品經(jīng)理石超說，以掃地機器人為例，需求側(cè)的轉(zhuǎn)變決定了產(chǎn)品必須從“平面打掃”轉(zhuǎn)向“立體清潔”，推動掃地機器人從去年長出“手”，到今年進一步進化出“雙腿”。中國家用電器協(xié)會執(zhí)行理事長姜風預測，下一步，家…

03-18

禾賽與小牛電動攜手，純固態(tài)補盲雷達助力兩輪車安全感知升級

03-18

2026年純電動車續(xù)航大比拼：多款車型突破900km，榜首達1036km

03-18

小米HAD輔助駕駛升級XLA大模型新一代SU7全系標配 3月19日正式上市

03-18

折疊屏手機新賽道：中國廠商領(lǐng)跑，蘋果入場前格局已變

03-18

vivo X300 Ultra影像大升級：首發(fā)3°光學防抖長焦，全焦段配置拉滿

03-18

vivo X300s即將登場：大屏旗艦定位，視聽觸體驗全面升級

03-18

安迪·賈西：AI助力AWS十年后年營收或達6000億美元，無人機配送將達百萬次

03-18

百度人事變動：何徑舟輪崗履新百度APP研發(fā)中心負責人趙世奇因個人原因離職

03-18

京東3C數(shù)碼政企服務(wù)：以全場景方案驅(qū)動制造業(yè)數(shù)智化轉(zhuǎn)型新引擎

在此背景下，京東3C數(shù)碼政企業(yè)務(wù)依托一體化供應(yīng)鏈核心優(yōu)勢，構(gòu)建覆蓋企業(yè)經(jīng)營全場景的服務(wù)能力，并推出《益千行百業(yè)，AI重塑未來辦公》系列視頻，以制造業(yè)為核心案例，詮釋京東3C數(shù)碼產(chǎn)品如何激活企業(yè)全鏈路生產(chǎn)力，推…

03-18

阿里成立ATH事業(yè)群，企業(yè)級AI工作平臺“悟空”邀測開啟重構(gòu)辦公新生態(tài)

悟空是一款獨立應(yīng)用，意圖讓每個團隊、每家公司都能擁有一支24h工作的“AI Agent軍團”。舉例來看，如果AI在編輯合同文檔時不慎刪除了關(guān)鍵條款，用戶發(fā)現(xiàn)后，可以一條命令回退到修改前的版本，系統(tǒng)同時展示…

03-18

點擊查看更多 +

全站最新

中韓半導體ETF(931790)漲超5%

A股異動丨東方海洋跌逾4% 國元基金累計減持5865.75萬股

互聯(lián)網(wǎng)喧囂中，我以“慢內(nèi)容”筑造價值小世界，堅守深度與真實

京東3C數(shù)碼政企服務(wù)：以全場景方案驅(qū)動制造業(yè)數(shù)智化轉(zhuǎn)型新引擎

阿里成立ATH事業(yè)群，企業(yè)級AI工作平臺“悟空”邀測開啟重構(gòu)辦公新生態(tài)

2026社媒營銷新引擎：AI客服以大模型之力驅(qū)動全鏈路降本增效實戰(zhàn)

熱門內(nèi)容

本欄最新

京東3C數(shù)碼政企服務(wù)：以全場景方案驅(qū)動制造業(yè)數(shù)智化轉(zhuǎn)型新引擎

阿里成立ATH事業(yè)群，企業(yè)級AI工作平臺“悟空”邀測開啟重構(gòu)辦公新生態(tài)

2026社媒營銷新引擎：AI客服以大模型之力驅(qū)動全鏈路降本增效實戰(zhàn)

阿里巴巴“阿里悟空”商標早布局，全球首個企業(yè)級AI原生平臺亮相引關(guān)注

宇樹科技王興興：人形機器人將迎速度突破，具身智能未來可期

2026上海冷鏈物流競爭白熱化，哪些企業(yè)能憑實力與創(chuàng)新領(lǐng)跑行業(yè)？

本網(wǎng)站LOGO小熊標志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

谷歌Gemini安卓測試版升級：雙模態(tài)交互助力AI圖像編輯邁向?qū)I(yè)化