本發(fā)明公開一種基于近端策略優(yōu)化的用戶實時自治能量管理優(yōu)化方法,管理優(yōu)化方法包括S1:對用戶DER設(shè)備進行分類和建模;S2:基于S1中對用戶DER設(shè)備的分類及建模,將用戶實時自治能量管理優(yōu)化問題建模為序貫決策問題;S3:利用長短期記憶神經(jīng)網(wǎng)絡(luò)提取實時的時序數(shù)據(jù)的未來走勢,輔助步驟S4和S5中深度強化學(xué)習(xí)進行策略優(yōu)化;S4:將S3中提取的未來走勢和能量管理智能體觀測的內(nèi)部狀態(tài)特征輸入到基于深度神經(jīng)網(wǎng)絡(luò)的策略函數(shù),賦能能量管理智能同時學(xué)習(xí)離散與連續(xù)動作,實現(xiàn)對各設(shè)備的控制;S5:采用基于近端策略優(yōu)化算法賦能在S4中的離散與連續(xù)動作中學(xué)習(xí)能量管理優(yōu)化策略。本發(fā)明管理優(yōu)化方法最小化用電成本的同時提升策略對不確定性的適應(yīng)性。
聲明:
“基于近端策略優(yōu)化的用戶實時自治能量管理優(yōu)化方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)