本發(fā)明提出一種基于強(qiáng)化學(xué)習(xí)的跨域異構(gòu)集群路徑規(guī)劃方法,通過添加集群的特征作為個體觀測輸入,并通過面向集群路徑規(guī)劃而設(shè)定的獎勵函數(shù),使得跨域的集群個體能夠在保持安全距離的前提下,進(jìn)行路徑規(guī)劃。本發(fā)明構(gòu)建了跨域異構(gòu)集群機(jī)動的馬爾科夫決策過程和獎勵函數(shù),利用MADDPG算法求解集群個體機(jī)動策略,從而實現(xiàn)跨域異構(gòu)集群的路徑規(guī)劃。只要集群個體具備相關(guān)的傳感器,即能通過本發(fā)明的方法實現(xiàn)路徑規(guī)劃。該方法下,來自空域、海域、陸域等域的不同航行器可以共同地進(jìn)行路徑規(guī)劃,從而實現(xiàn)“跨域異構(gòu)路徑規(guī)劃”。
聲明:
“基于強(qiáng)化學(xué)習(xí)的跨域異構(gòu)集群路徑規(guī)劃方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)