本申請涉及內(nèi)在激勵強化學(xué)習(xí)領(lǐng)域,特別涉及一種基于文本游戲的強化學(xué)習(xí)情感分析系統(tǒng),包括如下模塊:表示狀態(tài)的文本描述模塊、情緒分析模塊、外部環(huán)境模塊和LSTM?DQN模型模塊,所述表示狀態(tài)的文本描述模塊用于表示狀態(tài)的文本描述的輸入;所述情緒分析模塊用于分析所述表示狀態(tài)的文本描述中的積極和消極軌跡,生成基于情感的獎勵;所述外部環(huán)境模塊用于給出外部環(huán)境的獎勵;LSTM?DQN模型模塊用于對所述文本描述的狀態(tài)表示進行編碼,使用環(huán)境給出的獎勵,并從狀態(tài)表示中提取基于情感的獎勵作為補充;本發(fā)明將稀疏性獎勵問題轉(zhuǎn)化為稠密性獎勵問題,提高強化學(xué)習(xí)在處理所述問題的性能,實現(xiàn)了無獎勵環(huán)境下的自發(fā)學(xué)習(xí),提高了強化學(xué)習(xí)在基于文本游戲中的表現(xiàn)。
聲明:
“基于文本游戲的強化學(xué)習(xí)情感分析系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)