岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

快手全新「檢索數據引擎」CroPS 入選AAAI 2026 Oral

   時間:2026-01-16 08:58:25 來源:互聯網編輯:茹茹 IP:北京 發表評論無障礙通道
 

短視頻搜索業務是向量檢索在工業界最核心的應用場景之一。然而,當前業界普遍采用的“自強化”訓練范式過度依賴歷史點擊數據,導致系統陷入信息繭房,難以召回潛在相關的新鮮內容。針對當前挑戰,快手搜索團隊提出了CroPS框架,從根源上打破數據閉環。目前,CroPS已在快手搜索業務中實現全量部署,服務億級用戶。

本工作相關成果《CroPS: Improving Dense Retrieval with Cross-Perspective Positive Samples in Short-Video Search》已被人工智能頂級會議AAAI 2026 Oral接收。

為了打破數據邊界,CroPS 框架構建了一個包含三個維度的正樣本增強引擎,分別利用用戶換Query行為、推薦系統反饋以及大語言模型(LLM)的世界知識,來全方位地豐富語義空間。圍繞這一目標,CroPS 分別從查詢行為、系統反饋和外部知識三個層面展開。

在真實的搜索場景中,用戶往往難以一次性精準表達意圖。當用戶輸入查詢詞A 卻未能找到滿意結果時,通常會進行查詢重構,輸入語義相關但表述不同的查詢詞B。CroPS 通過分析用戶在短時間窗口內的改寫序列,將改寫后獲得的成功點擊回流給原始查詢,利用用戶的修正行為來糾正模型的語義偏差。

推薦系統擁有海量用戶消費數據,其算法機制天然傾向于發散和探索。CroPS 建立了一套跨系統的信號橋接機制:對于同一個用戶,如果他在推薦信息流中深度消費了某個視頻,且該視頻在語義上與用戶近期的搜索詞高度相關,該視頻就會被引入作為搜索模型的正樣本。

當平臺現有的內容庫或日志無法覆蓋某些長尾、復雜查詢時,CroPS 引入大語言模型(LLM)作為虛擬檢索器和內容生成器,利用 One-shot Prompting 策略生成高質量合成樣本,將外部世界的常識與邏輯蒸餾進檢索模型中。

在多源正樣本被引入之后,如何讓模型有效利用這些信號,同樣成為訓練階段的關鍵。HLA 的核心是解決 CroPS 多源正樣本的可靠性差異問題,通過為樣本分配分層標簽,讓模型能夠學習更細粒度的相關性。H-InfoNCE 在訓練時,將當前樣本與標簽嚴格低于它的所有樣本進行對比,使學習目標與 HLA 的層級邏輯完全對齊。

這一系列設計共同構成了 CroPS 在工業檢索場景中的完整解決方案。CroPS 證明了在工業檢索系統中,正樣本增強是緩解信息繭房問題的有效鑰匙。未來,快手搜索團隊將進一步探索 CroPS 與生成式檢索(Generative Retrieval)方法的融合,持續挖掘大規模語言模型在搜索全鏈路中的潛力。

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 影音先锋在线视频 | 亚洲视频成人 | 丝袜美腿亚洲综合 | 日韩av男人天堂 | 午夜精品一区二区三区在线播放 | 自拍偷拍 亚洲 | 大香焦伊人 | 久久国产秒 | 双性总裁受胸罩大有奶水bl | 狠狠爱综合网 | 夜夜爽影院 | 又紧又大又爽精品一区二区 | 欧美九九九 | 看av网址| 四虎国产成人永久精品免费 | 成人黄页 | 天堂网免费视频 | 色网站在线观看 | 深夜成人福利视频 | 日韩在线 | 五月在线 | 亚洲一区精品在线观看 | 自拍偷拍在线视频 | 色综合久久久久 | xxx日本黄色 | 久久久99国产精品免费 | 亚洲天堂男人天堂 | 香蕉视频网站在线 | 日韩中文免费 | aaa成人| 免费中文字幕在线观看 | 日韩久久中文字幕 | 亚洲天堂影视 | 在线观看欧美精品 | 午夜免费在线 | 欧美午夜精品久久久久免费视 | wwwxxx亚洲 | 人人干在线观看 | 一区二区三区四区视频 | 成年人免费看片 | 色综合色综合网色综合 |