本發(fā)明提供一種基于DRL的四足機(jī)器人路徑規(guī)劃方法,首先通過四足機(jī)器人自帶的RGB?D相機(jī)對環(huán)境進(jìn)行預(yù)掃描,基于柵格法對運(yùn)動環(huán)境進(jìn)行建模得到環(huán)境地圖,進(jìn)而分解為一系列具有二值信息的柵格單元,得到初始狀態(tài),將其作為深度卷積神經(jīng)網(wǎng)絡(luò)的輸入,引入注意力機(jī)制優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)以解決深度強(qiáng)化學(xué)習(xí)DQN算法未能很好利用關(guān)鍵局部信息的問題;通過端對端訓(xùn)練,結(jié)合四足機(jī)器人的運(yùn)動特點(diǎn)設(shè)置獎勵函數(shù),利用置信區(qū)間上界探索策略對神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到四足機(jī)器人所能夠執(zhí)行的八個動作的Q值;最后運(yùn)用人工勢場算法不斷探測環(huán)境中的動態(tài)障礙物并進(jìn)行實(shí)時避礙,實(shí)現(xiàn)有效的四足機(jī)器人路徑規(guī)劃。
聲明:
“基于DRL的四足機(jī)器人路徑規(guī)劃方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)