本公開提供了一種路徑規(guī)劃模型的訓(xùn)練方法和路徑規(guī)劃方法、裝置、設(shè)備、介質(zhì),涉及人工智能領(lǐng)域,具體涉及深度學(xué)習(xí)和計算機視覺領(lǐng)域,可應(yīng)用于自動駕駛和機械生產(chǎn)等場景。訓(xùn)練方法的具體實現(xiàn)方案包括:采用編碼網(wǎng)絡(luò)對第一樣本數(shù)據(jù)中的第一環(huán)境數(shù)據(jù)進行編碼,獲得第一環(huán)境數(shù)據(jù)的第一特征數(shù)據(jù),該第一樣本數(shù)據(jù)還包括第一實際路徑數(shù)據(jù);將第一特征數(shù)據(jù)輸入深度強化學(xué)習(xí)網(wǎng)絡(luò),得到針對第一環(huán)境數(shù)據(jù)的預(yù)測路徑數(shù)據(jù);基于第一實際路徑數(shù)據(jù)和針對第一環(huán)境數(shù)據(jù)的預(yù)測路徑數(shù)據(jù),對編碼網(wǎng)絡(luò)和深度強化學(xué)習(xí)網(wǎng)絡(luò)進行訓(xùn)練。其中,編碼網(wǎng)絡(luò)是采用第二樣本數(shù)據(jù)預(yù)訓(xùn)練得到的,第二樣本數(shù)據(jù)包括第一樣本數(shù)據(jù)所屬的目標領(lǐng)域的數(shù)據(jù)及除目標領(lǐng)域外其他領(lǐng)域的數(shù)據(jù)。
聲明:
“路徑規(guī)劃模型的訓(xùn)練方法和路徑規(guī)劃方法、裝置” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)