本發(fā)明涉及深度強化學習和金融量化交易領域,為基于強化學習算法與時間序列模型的股票交易方法及系統(tǒng),其方法包括步驟:數(shù)據(jù)預處理,對收集的股票數(shù)據(jù)按類別進行整理,過濾錯誤數(shù)據(jù)、重復數(shù)據(jù),數(shù)據(jù)歸一化,預處理完成后得到得到股票數(shù)據(jù)集;建立時間序列模型預測股票價格,對股票基礎價格數(shù)據(jù)集進行劃分,建立并訓練可用于股票基礎價格數(shù)據(jù)的時間序列GRU模型,輸出股票預測價格;股票交易強化學習模型輸出決策,應用PPO算法訓練智能體得到應用于股票交易的強化學習模型以輸出股票交易的行動決策。本發(fā)明可以充分挖掘潛藏于股票基礎數(shù)據(jù)中的信息,在股票交易環(huán)境中作出合理交易決策,為現(xiàn)實股票交易相關人員提供參考。
聲明:
“基于強化學習算法與時間序列模型的股票交易方法及系統(tǒng)” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)