本發(fā)明屬于水面無(wú)人艇軌跡跟蹤控制技術(shù)領(lǐng)域,具體涉及一種基于強(qiáng)化學(xué)習(xí)MPC的無(wú)人艇軌跡跟蹤控制方法。本發(fā)明在無(wú)人艇的MPC軌跡跟蹤控制器設(shè)計(jì)過(guò)程中,選用無(wú)人艇的運(yùn)動(dòng)學(xué)模型和操縱響應(yīng)模型作為預(yù)測(cè)模型,根據(jù)無(wú)人艇軌跡跟蹤任務(wù)需求構(gòu)造控制性能指標(biāo)函數(shù),在MPC滾動(dòng)優(yōu)化過(guò)程中利用強(qiáng)化學(xué)習(xí)的DDPG算法構(gòu)建性能指標(biāo)函數(shù)的求解器,通過(guò)最小化性能指標(biāo)函數(shù)求解出軌跡跟蹤的最優(yōu)控制序列,最終將每時(shí)刻控制序列的第一個(gè)控制量作用于無(wú)人艇系統(tǒng)上。本發(fā)明提高了軌跡跟蹤控制的魯棒性和抗干擾,同時(shí)具備自學(xué)習(xí)能力,適應(yīng)于復(fù)雜的海況環(huán)境,相較于傳統(tǒng)的MPC控制算法其自主性和實(shí)時(shí)性更強(qiáng),跟蹤誤差更小。
聲明:
“基于強(qiáng)化學(xué)習(xí)MPC的無(wú)人艇軌跡跟蹤控制方法” 該技術(shù)專(zhuān)利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)