一種基于強化學習算法與未知干擾觀測器的多AUV編隊分布式控制方法,屬于機器人控制技術(shù)領(lǐng)域。為了解決現(xiàn)有的控制方法對AUV編隊進行控制存在控制精度差的問題,本發(fā)明針對多AUV編隊中的AUV,利用縱向和艏向的復(fù)合控制系統(tǒng)進行控制;縱向和艏向的復(fù)合控制系統(tǒng)包括:基于縱向干擾觀測器確定的縱向分布式控制器、基于艏向干擾觀測器確定的艏向分布式控制器,以及用于確定控制器控制增益的Actor?Critic算法;Actor?Critic算法由Actor當前網(wǎng)絡(luò)、Actor目標網(wǎng)絡(luò)、Critic當前網(wǎng)絡(luò)和Critic目標網(wǎng)絡(luò)四個網(wǎng)絡(luò)構(gòu)成,四個網(wǎng)絡(luò)均使用RBF神經(jīng)網(wǎng)絡(luò)。本發(fā)明主要用于水下機器人的控制。
聲明:
“基于強化學習算法與未知干擾觀測器的多AUV編隊分布式控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)