格隆匯2月28日|據(jù)企查查,近日,優(yōu)必選申請公布“機(jī)器人控制模型的訓(xùn)練方法、裝置、電子設(shè)備及存儲介質(zhì)”專利。專利摘要顯示,方法包括:根據(jù)第一總獎(jiǎng)勵(lì)函數(shù)對初始的運(yùn)動控制模型進(jìn)行訓(xùn)練處理,得到第一運(yùn)動控制模型;根據(jù)第二總獎(jiǎng)勵(lì)函數(shù)對初始的導(dǎo)航控制模型進(jìn)行訓(xùn)練處理,得到第一導(dǎo)航控制模型;在維持第一導(dǎo)航控制模型參數(shù)不變的情況下,基于第一導(dǎo)航控制模型輸出的第一預(yù)測速度、第二子獎(jiǎng)勵(lì)函數(shù)以及第一總獎(jiǎng)勵(lì)函數(shù),對第一運(yùn)動控制模型進(jìn)行訓(xùn)練,得到第二運(yùn)動控制模型;對第二運(yùn)動控制模型以及第一導(dǎo)航控制模型的參數(shù)進(jìn)行微調(diào)處理,得到用于控制機(jī)器人規(guī)避障礙物的模型。通過本申請,能夠通過導(dǎo)航控制模型和運(yùn)動控制模型之間的強(qiáng)化學(xué)習(xí),提升機(jī)器人的運(yùn)動控制準(zhǔn)確性以及效率。










