本發(fā)明公開了一種基于生成對抗模仿學(xué)習(xí)的電力系統(tǒng)動(dòng)態(tài)經(jīng)濟(jì)調(diào)度系統(tǒng)及方法,首先,生成器網(wǎng)絡(luò)模塊觀測電力系統(tǒng)狀態(tài),采用強(qiáng)化學(xué)習(xí)近端策略優(yōu)化算法生成調(diào)度策略;其次,完美調(diào)度模塊生成完美調(diào)度策略;再次,判別器網(wǎng)絡(luò)模塊將所述生成器網(wǎng)絡(luò)模塊生成的調(diào)度策略與完美調(diào)度策略進(jìn)行對比,得出反饋信息來訓(xùn)練生成器網(wǎng)絡(luò)參數(shù)與判別器網(wǎng)絡(luò)參數(shù);最后,生成器網(wǎng)絡(luò)模塊基于判別器網(wǎng)絡(luò)模塊訓(xùn)練后的生成器網(wǎng)絡(luò)參數(shù),結(jié)合電力系統(tǒng)狀態(tài)獲得最終的調(diào)度策略。本發(fā)明結(jié)合生成對抗網(wǎng)絡(luò),避免了深度強(qiáng)化學(xué)習(xí)中人為定義獎(jiǎng)勵(lì)函數(shù)引入的主觀性,實(shí)現(xiàn)策略到策略的端到端的學(xué)習(xí),改善了算法的收斂性問題,降低建模難度,增強(qiáng)了算法應(yīng)對高維復(fù)雜問題時(shí)的能力。
聲明:
“基于生成對抗模仿學(xué)習(xí)的電力系統(tǒng)動(dòng)態(tài)經(jīng)濟(jì)調(diào)度系統(tǒng)及方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)