本發(fā)明公開了基于深度強化學(xué)習(xí)的無人駕駛分層運動決策控制方法,以“元動作決策?車輛控制”層次化運動決策控制模型為載體實現(xiàn)的。通過對駕駛行為的抽象分解和對影響駕駛行為的環(huán)境因素分析,以將運動決策控制過程分解為“元動作決策?車輛控制”的模式實現(xiàn)的,元動作決策屬于離散型決策問題,利用DQN深度強化學(xué)習(xí)算法建立一個由動態(tài)駕駛信息到元動作的端到端模型。車輛控制屬于連續(xù)型動作輸出,采用DDPG深度強化學(xué)習(xí)算法建立一個從道路信息與元動作,映射到油門、剎車和方向盤控制量的端到端模型,神經(jīng)網(wǎng)絡(luò)的搭建使用PyTorch深度學(xué)習(xí)框架,選擇的開發(fā)語言是Python,模型通過接收駕駛行為指令并結(jié)合環(huán)境狀態(tài)信息,輸出車輛的控制量。
聲明:
“基于深度強化學(xué)習(xí)的無人駕駛分層運動決策控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)