岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

<address id="cvgvv"></address>

ITBear科技資訊
手機版
二維碼
內容搜索
無障礙通道
語言：中文 EN

ITBear旗下自媒體矩陣：

滾動資訊

當前位置：首頁 > 資訊 > 信息流 > 正文內容

LongHorizonUI框架：破解GUI智能體長鏈路任務難題，推動自動化落地

時間：2026-03-12 16:45:38 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

在移動設備和桌面系統的日常操作中，許多復雜任務的完成往往需要連續進行數十次交互。從預訂會議到在游戲商城購買裝備，再到跨應用完成工作流，這些長鏈路操作對自動化技術提出了嚴峻挑戰。盡管基于多模態大語言模型的GUI智能體已取得顯著進展，但當任務步驟超過10-15步時，現有方法的成功率會出現斷崖式下降，這成為制約技術落地的關鍵瓶頸。

針對這一難題，由多所高校與科研機構聯合研發的LongHorizonUI框架近日取得突破性進展。該研究構建了首個專注于長鏈路場景的評測基準LongGUIBench，并提出包含增強感知、深度反思決策與補償式執行三大核心模塊的統一解決方案。相關成果已被國際學習表征會議（ICLR 2026）接收，為復雜場景下的GUI自動化提供了全新范式。

研究團隊通過系統性實驗發現，現有方法在長鏈路任務中存在感知漂移、定位偏差和決策誤差累積的問題。在AndroidControl基準測試中，當操作序列超過15步時，主流方法的平均成功率不足60%，遠低于5步內90%以上的成功率。這種非線性衰減表明，跨步狀態依賴的有效捕捉是提升長鏈路任務執行能力的關鍵。

為構建更具挑戰性的評測環境，LongGUIBench基準特別設計了包含15款主流應用和13款熱門游戲的測試集。所有任務操作步數均不低于15步，平均達到22.1步。其中游戲場景任務最長可達37步，覆蓋裝備管理、活動參與等核心機制。每條任務均提供高階目標描述與原子操作序列的雙重指令標注，并配備精細的UI語義信息，包括控件類型、位置坐標和狀態屬性。

在技術實現層面，LongHorizonUI通過分層處理不確定性構建完整閉環。多模態增強感知模塊采用控件檢測與OCR識別并行架構，為每個UI元素分配唯一空間索引作為穩定錨點。針對復合控件的識別難題，該模塊引入基于交并比的語義綁定機制，當圖標與文本檢測框重疊度超過閾值時自動關聯為同一實體。對于彈窗關閉按鈕等關鍵元素，系統在高優先區域設置模板匹配修復機制，確保關鍵操作不被遺漏。

深度反思決策模塊通過強制三級閉環推理提升決策可靠性。該模塊首先驗證上一步操作是否成功執行，接著檢查當前界面狀態與任務目標的一致性，最后要求模型在給出執行指令前說明操作依據。在動作執行前，系統會校驗目標元素是否存在、動作語義是否匹配，不滿足條件的指令將被拒絕并觸發修正機制。

補償式執行器則通過多級定位策略應對物理執行中的不確定性。系統優先使用元素索引定位控件質心，失敗時在檢測框內隨機采樣點擊點，若仍無法執行則回退到屏幕絕對坐標并添加微小擾動。每次操作后，系統會驗證執行結果，當所有定位策略均失效時觸發局部重規劃或回滾到上一個成功狀態繼續執行。

實驗數據顯示，LongHorizonUI在LongGUIBench基準上取得顯著優勢。在通用應用場景中，低級指令步驟成功率達到85.3%，高級指令成功率達52.3%，較對比方法分別提升6.1%和30.5%。游戲場景中同樣保持領先，整體平均成功率達77.3%。在跨平臺UI元素定位基準ScreenSpot上，該框架以90.4%的平均準確率超越所有開源方法，在Icon類元素識別上表現尤為突出。

消融實驗進一步驗證了各模塊的必要性。移除控件檢測器導致步驟完成率下降6.1%，僅使用索引定位的任務完成率為81.4%，而疊加補償策略后提升至85.3%。在超長鏈路測試中，該框架在50步任務中取得29.4%的成功率，較對比方法提升4.8個百分點，充分證明其在極端復雜場景下的魯棒性。

更多>同類資訊

中國信通院推進智能助理智能體Claw標準建設提醒用戶防范安全風險

03-12

AI“龍蝦”群內意外泄密主人指令反被教育安全風險引關注

03-12

A股異動丨AI應用概念股普跌，藍色光標跌超3%

03-12

機構：人工智能日益被視為關鍵投資回報驅動力

03-12

多款新型航天產品亮相2026上海商業航天大會

03-12

拘捕8人！香港廉署證監打擊持牌機構高層涉內幕交易及貪污：提前泄露配股機密

03-12

專家談公積金改革方向將會傾向二手房

03-12

三菱日聯：石油儲備釋放速度是決定有效性的關鍵

03-12

越南擬增加大米儲備以穩定市場

03-12

機構：出口價格上調瓶片期價強勢漲停

03-12

天問三號任務總設計師劉繼忠：嫦娥七號計劃于今年發射

03-12

機構：中東局勢明朗前，歐洲央行料“按兵不動”但保留選擇權

03-12

能源沖擊終結降息夢土耳其面臨通脹與戰爭雙重夾擊

03-12

投行Oppenheimer：未來戰場將圍繞無人機全面重構全球無人機市場規模可能擴大至4000億美元

03-12

日股收跌1.04%

03-12

點擊查看更多 +

全站最新

AI“龍蝦”在廈門掀起熱潮：能干活會進化，但安全風險需警惕

AI“龍蝦”在廈門掀起熱潮：能干活會進化，但安全風險需警惕

茅臺價格波動：電商平臺補貼價走低，市場化改革路徑漸明

茅臺價格波動：電商平臺補貼價走低，市場化改革路徑漸明

A股異動丨AI應用概念股普跌，藍色光標跌超3%

A股異動丨AI應用概念股普跌，藍色光標跌超3%

日股收跌1.04%

日股收跌1.04%

韓股收跌0.62%

韓股收跌0.62%

A股異動丨風電股強勢，英國自4月1日起取消33項風電組件進口關稅

A股異動丨風電股強勢，英國自4月1日起取消33項風電組件進口關稅

熱門內容

本欄最新

韓股收跌0.62%

韓股收跌0.62%

A股異動丨風電股強勢，英國自4月1日起取消33項風電組件進口關稅

A股異動丨風電股強勢，英國自4月1日起取消33項風電組件進口關稅

A股異動丨天味食品跌近5%創逾四個月新低，2025年凈利潤同比下降8.79%

A股異動丨天味食品跌近5%創逾四個月新低，2025年凈利潤同比下降8.79%

畜牧養殖板塊逆勢上漲，農業ETF易方達、農牧漁ETF、養殖ETF、畜牧養殖ETF上漲

畜牧養殖板塊逆勢上漲，農業ETF易方達、農牧漁ETF、養殖ETF、畜牧養殖ETF上漲

上證50、滬深300均跌超1%

上證50、滬深300均跌超1%

澳股收跌1.31%

澳股收跌1.31%

網站首頁 | 關于我們 | 聯系方式 | 版權聲明 | 爭議稿件處理 | English Version

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

主站蜘蛛池模板：蜜臀久久99精品久久久久宅男 | 朝桐光x88av 国产亚洲精品久久久久久国产免费嫩草影院 | 久久久伊人网 | 久久久极品| 国产日产精品一区二区三区 | 精品视频在线一区 | 国产视频福利在线 | 国产亚洲欧美一区二区 | 看av网站 | 狠狠操狠狠插 | 韩国中文字幕hd久久精品 | 男女国产视频 | 中文精品在线 | 婷婷精品进入 | 国产精品一区二区免费视频 | 国产视频1区2区 | www黄色| 六月综合网| 亚洲欧美视频在线观看 | 天堂网在线视频 | 亚洲视频入口 | 99视频在线观看免费 | 看av在线| 福利视频在线导航 | 欧美综合一区 | 婷婷久久综合 | 中文字幕一区二区三区在线播放 | 国产传媒一区二区三区 | 国产免费美女视频 | 国产精品中文字幕在线观看 | 亚洲最新网址 | 69福利视频 | 欧美经典一区二区三区 | 中文字幕一区二区三区在线观看 | 日韩在线播放视频 | 成人免费看片视频在线观看 | 在线观看欧美视频 | 男人的天堂在线播放 | 亚洲成av | 午夜aaaa| av中文在线 |

<address id="b7d4u"></address>

<td id="b7d4u"></td>

<object id="b7d4u"></object>