本發(fā)明涉及機(jī)器人智能控制領(lǐng)域,特別涉及基于模型預(yù)測(cè)控制優(yōu)化強(qiáng)化學(xué)習(xí)的四足機(jī)器人控制方法,包括:根據(jù)物理樣機(jī)的物理參數(shù)建立動(dòng)力學(xué)模型,并將動(dòng)力學(xué)模型轉(zhuǎn)化為狀態(tài)空間方程;根據(jù)狀態(tài)空間方程優(yōu)化模型預(yù)測(cè)控制,并將優(yōu)化后的模型預(yù)測(cè)控制部署到物理樣機(jī)上;建立強(qiáng)化學(xué)習(xí)模型,強(qiáng)化學(xué)習(xí)模型與環(huán)境、模型預(yù)測(cè)控制同時(shí)交互訓(xùn)練物理樣機(jī)。通過基于模型預(yù)測(cè)控制優(yōu)化強(qiáng)化學(xué)習(xí)降低訓(xùn)練過程中產(chǎn)生的無意義數(shù)據(jù),通過模型引導(dǎo)訓(xùn)練降低對(duì)算力的需求,能直接部署于物理樣機(jī)訓(xùn)練減少訓(xùn)練過程解決了基于價(jià)值和策略的算法對(duì)數(shù)據(jù)和算力要求高,需要昂貴的計(jì)算機(jī)設(shè)備進(jìn)行預(yù)訓(xùn)練才能夠初步達(dá)到機(jī)器人的控制效果,在部署到物理樣機(jī)后還需進(jìn)行長(zhǎng)時(shí)間訓(xùn)練的問題。
聲明:
“基于模型預(yù)測(cè)控制優(yōu)化強(qiáng)化學(xué)習(xí)的四足機(jī)器人控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)