一種基于多智能體強(qiáng)化學(xué)習(xí)的機(jī)械臂抗干擾運(yùn)動(dòng)規(guī)劃方法,屬于機(jī)器人運(yùn)動(dòng)規(guī)劃與智能控制的技術(shù)領(lǐng)域。本發(fā)明為了解決基于強(qiáng)化學(xué)習(xí)的機(jī)械臂神經(jīng)運(yùn)動(dòng)規(guī)劃器抗干擾能力弱的問(wèn)題而提出。本發(fā)明包括:通過(guò)對(duì)機(jī)械臂關(guān)節(jié)圖的建立和關(guān)聯(lián)關(guān)系分析,提出了對(duì)單一機(jī)械臂的多智能體分解方法;基于集中式學(xué)習(xí)架構(gòu)的多智能體SAC強(qiáng)化學(xué)習(xí)算法實(shí)現(xiàn)了機(jī)械臂多智能體強(qiáng)化學(xué)習(xí)的訓(xùn)練。通過(guò)在運(yùn)動(dòng)規(guī)劃過(guò)程中分別施加動(dòng)作擾動(dòng)、關(guān)節(jié)鎖定和觀測(cè)擾動(dòng),驗(yàn)證了所提出的離散化后的多智能體機(jī)械臂強(qiáng)化學(xué)習(xí)運(yùn)動(dòng)規(guī)劃方法相比于傳統(tǒng)單智能體具備更強(qiáng)的抗干擾能力。本發(fā)明用于機(jī)械臂的運(yùn)動(dòng)規(guī)劃與智能控制領(lǐng)域。
聲明:
“基于多智能體強(qiáng)化學(xué)習(xí)的機(jī)械臂抗干擾運(yùn)動(dòng)規(guī)劃方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)