本發(fā)明公布了一種電力物聯(lián)網(wǎng)中基于深度強(qiáng)化學(xué)習(xí)的計(jì)算任務(wù)卸載方法,旨在通過聯(lián)合優(yōu)化無(wú)人機(jī)位置、發(fā)射功率和任務(wù)劃分變量來最小化能耗和時(shí)延。首先,針對(duì)計(jì)算任務(wù)卸載問題的非凸性,通過設(shè)計(jì)狀態(tài)、動(dòng)作空間和獎(jiǎng)勵(lì)函數(shù),制定了馬爾可夫決策過程,獎(jiǎng)勵(lì)函數(shù)基于面向輸電線路巡檢的電力物聯(lián)網(wǎng)系統(tǒng)模型,涉及采集設(shè)備、巡檢無(wú)人機(jī)和邊緣服務(wù)器之間的交互,對(duì)計(jì)算任務(wù)卸載問題進(jìn)行描述。在此基礎(chǔ)上,由于馬爾可夫模型具有連續(xù)的動(dòng)作空間,提出了雙延遲深度確定性策略梯度算法,獲得了任務(wù)卸載的最優(yōu)策略。
聲明:
“電力物聯(lián)網(wǎng)中基于深度強(qiáng)化學(xué)習(xí)的計(jì)算任務(wù)卸載方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)