本發(fā)明采用深度強化學習技術(shù),將糧食庫的狀況檢測與健康情況預(yù)測前一周期的預(yù)測結(jié)果與采集到真實結(jié)果進行比較,以差距的大小區(qū)間設(shè)置獎勵或者懲罰,模型為了得到獎勵,會修正自身以保持預(yù)測結(jié)果在設(shè)置好的獎勵區(qū)間內(nèi),實現(xiàn)對糧食庫數(shù)據(jù)的可靠預(yù)測。本發(fā)明具備一般非線性模型的預(yù)測能力強的優(yōu)點,結(jié)合了強化學習的環(huán)境反饋能力,將這種能力應(yīng)用在對未來一定周期的數(shù)據(jù)預(yù)測反饋上,提高了一定周期的糧食庫狀況檢測與健康情況預(yù)測數(shù)據(jù)的高度可靠度。
聲明:
“糧食庫健康狀況預(yù)測方法,存儲設(shè)備及服務(wù)器” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)