本發(fā)明提供了一種基于深度確定性策略梯度的自適應(yīng)控制方法,依據(jù)真實系統(tǒng)特性構(gòu)建的仿真訓(xùn)練環(huán)境;構(gòu)建狀態(tài)(觀測量),回報函數(shù),截止條件,動作;構(gòu)建深度確定性策略梯度方法的critic網(wǎng)絡(luò)、actor網(wǎng)絡(luò)和相應(yīng)的目標(biāo)網(wǎng)絡(luò),通過與仿真訓(xùn)練環(huán)境的試錯交互進行訓(xùn)練;使用actor網(wǎng)絡(luò)訓(xùn)練結(jié)果作為該系統(tǒng)的控制器。本發(fā)明將深度強化學(xué)習(xí)方法應(yīng)用于控制器設(shè)計,介紹該方法的實施步驟,通過離線仿真訓(xùn)練,達到控制器要求后移植到真實環(huán)境中,實現(xiàn)非線性系統(tǒng)自適應(yīng)控制。
聲明:
“基于深度確定性策略梯度的自適應(yīng)控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)