本發(fā)明公開(kāi)了一種神經(jīng)網(wǎng)絡(luò)到?jīng)Q策樹(shù)的轉(zhuǎn)換方法、存儲(chǔ)介質(zhì)及電子設(shè)備,方法包括:獲取局部視野網(wǎng)絡(luò)系統(tǒng)的強(qiáng)化學(xué)習(xí)決策環(huán)境和神經(jīng)網(wǎng)絡(luò)決策策略,向強(qiáng)化學(xué)習(xí)決策環(huán)境中輸入初始值以得到觀測(cè)值和觀測(cè)值對(duì)應(yīng)的值函數(shù),并將觀測(cè)值輸入至神經(jīng)網(wǎng)絡(luò)決策策略,以得到觀測(cè)值對(duì)應(yīng)的輸出決策和q值向量,并將輸出決策作為新的初始值,直至得到設(shè)定數(shù)量的觀測(cè)值和與每個(gè)觀測(cè)值對(duì)應(yīng)的輸出決策、值函數(shù)以及q值向量,并將每一個(gè)觀測(cè)值和觀測(cè)值對(duì)應(yīng)的決策、值函數(shù)以及q值向量作為一組數(shù)據(jù)以得到包括多組數(shù)據(jù)的數(shù)據(jù)集,利用決策樹(shù)算法對(duì)數(shù)據(jù)集進(jìn)行訓(xùn)練以得到目標(biāo)決策樹(shù),通過(guò)上述方法獲得的目標(biāo)決策樹(shù)結(jié)構(gòu)清晰且便于理解,并能夠?qū)Υ龥Q策觀測(cè)值進(jìn)行決策得到?jīng)Q策結(jié)果。
聲明:
“神經(jīng)網(wǎng)絡(luò)到?jīng)Q策樹(shù)的轉(zhuǎn)換方法、存儲(chǔ)介質(zhì)及電子設(shè)備” 該技術(shù)專(zhuān)利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)