一種基于強(qiáng)化學(xué)習(xí)的電力設(shè)備檢修決策生成方法涉及電力設(shè)備檢修技術(shù)領(lǐng)域,解決了現(xiàn)有基于強(qiáng)化學(xué)習(xí)的建模策略的方式需要大量的數(shù)據(jù)且數(shù)據(jù)利用率不高的問(wèn)題,包括:計(jì)算第一割集并據(jù)此計(jì)算電力設(shè)備引起電網(wǎng)停電損失的第一權(quán)重;將電力設(shè)備檢修決策生成問(wèn)題建模為一個(gè)馬爾可夫決策過(guò)程,定義電力設(shè)備的運(yùn)行狀態(tài);應(yīng)用強(qiáng)化學(xué)習(xí)方法求解馬爾可夫決策過(guò)程得到最優(yōu)策略和最優(yōu)策略的價(jià)值矩陣,第一權(quán)重加權(quán)到強(qiáng)化學(xué)習(xí)的電網(wǎng)的整體運(yùn)行損失中,強(qiáng)化學(xué)習(xí)以最小化電網(wǎng)的整體運(yùn)行損失為目標(biāo);計(jì)算第二割集并據(jù)此計(jì)算第二權(quán)重,加權(quán)到電網(wǎng)的整體運(yùn)行損失中,改進(jìn)最優(yōu)策略。本發(fā)明夠間接實(shí)現(xiàn)多個(gè)電力設(shè)備之間的通信,數(shù)據(jù)利用率高,在專業(yè)領(lǐng)域上的應(yīng)用門檻較低。
聲明:
“基于強(qiáng)化學(xué)習(xí)的電力設(shè)備檢修決策生成方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)