在時間序列預(yù)測領(lǐng)域,傳統(tǒng)方法常采用基于極大似然估計的均方誤差(MSE)作為損失函數(shù),但這類方法在處理具有自相關(guān)性的標(biāo)簽序列時存在明顯偏差。近期,一項由多所高校與企業(yè)聯(lián)合完成的研究提出全新解決方案,通過引入最優(yōu)傳輸理論中的Wasserstein距離,將預(yù)測問題轉(zhuǎn)化為條件分布對齊任務(wù),有效解決了傳統(tǒng)方法的局限性。
研究團隊指出,現(xiàn)有主流的直接預(yù)測范式(Direct Forecast)雖具備并行計算優(yōu)勢,但其依賴的時序均方誤差損失函數(shù)未能充分考慮標(biāo)簽序列的內(nèi)在幾何結(jié)構(gòu)。這種結(jié)構(gòu)特征表現(xiàn)為時間維度上的自相關(guān)性,即當(dāng)前時刻的值與前后時刻的值存在統(tǒng)計依賴關(guān)系。傳統(tǒng)損失函數(shù)在計算時默認各時間點獨立,導(dǎo)致模型訓(xùn)練過程中產(chǎn)生系統(tǒng)性偏差。
針對這一核心問題,研究人員提出名為DistDF的創(chuàng)新框架。該框架突破傳統(tǒng)極大似然估計范式,轉(zhuǎn)而通過最小化預(yù)測分布與真實條件分布之間的Wasserstein距離實現(xiàn)模型訓(xùn)練。理論推導(dǎo)證明,聯(lián)合分布的Wasserstein距離可作為條件分布距離期望的上界,這為通過優(yōu)化聯(lián)合分布間接實現(xiàn)條件分布對齊提供了數(shù)學(xué)依據(jù)。相較于直接計算條件分布距離,聯(lián)合分布對齊策略可利用全體數(shù)據(jù)集樣本,顯著提升距離估算的可靠性。
在具體實現(xiàn)層面,研究團隊在高斯分布假設(shè)下,將復(fù)雜的Wasserstein距離計算簡化為均值與協(xié)方差距離的加權(quán)和。這種基于Bures-Wasserstein距離的損失函數(shù)設(shè)計,既保證了數(shù)學(xué)嚴謹性,又大幅降低了計算復(fù)雜度。實驗數(shù)據(jù)顯示,在ECL數(shù)據(jù)集上,該框架使iTransformer模型的MSE指標(biāo)降低2.7%,驗證了其對標(biāo)簽自相關(guān)性的有效處理能力。
對比實驗表明,DistDF框架相較于FreDF和Time-o1等現(xiàn)有改進方法具有顯著優(yōu)勢。后兩者雖通過不同方式減少了似然估計偏差,但仍存在殘差偏差問題。DistDF通過直接優(yōu)化條件分布距離,實現(xiàn)了真正的無偏對齊。消融實驗進一步證實,均值對齊與協(xié)方差對齊的協(xié)同作用是性能提升的關(guān)鍵,單獨使用任一組件均可帶來改進,但聯(lián)合使用效果最佳。
可視化分析顯示,采用DistDF訓(xùn)練的模型生成的預(yù)測序列與真實標(biāo)簽具有更高擬合度,能有效抑制噪聲和異常波動。在困難樣本的外推任務(wù)中,該框架展現(xiàn)出更強的預(yù)測能力。值得注意的是,這種性能提升具有模型普適性——在TimeBridge、FredFormer、iTransformer和FreTS等多種主流架構(gòu)上均驗證了其有效性。
這項研究為時間序列預(yù)測領(lǐng)域提供了新的理論視角和技術(shù)路徑。通過將最優(yōu)傳輸理論引入損失函數(shù)設(shè)計,不僅解決了傳統(tǒng)方法在處理自相關(guān)數(shù)據(jù)時的固有缺陷,更開創(chuàng)了分布對齊技術(shù)在時序任務(wù)中的應(yīng)用范式。其核心思想——通過聯(lián)合分布優(yōu)化間接實現(xiàn)條件分布對齊——為相關(guān)領(lǐng)域的研究提供了可借鑒的方法論框架。











