一種基于強(qiáng)化學(xué)習(xí)與生成式對(duì)抗網(wǎng)絡(luò)的局部交通優(yōu)化方法,包括建立訓(xùn)練模型,采用生成對(duì)抗網(wǎng)絡(luò)自主提升模型的準(zhǔn)確率,通過訓(xùn)練某個(gè)路口檢測到的真實(shí)車流量數(shù)據(jù)預(yù)測指定時(shí)刻的車流量數(shù)據(jù);采用Q學(xué)習(xí)對(duì)真實(shí)車流量數(shù)據(jù)和虛擬車流量數(shù)據(jù)進(jìn)行訓(xùn)練輸出動(dòng)作形成Q值表,采用獎(jiǎng)賞函數(shù),得到最佳局部交通優(yōu)化策略,利用強(qiáng)化學(xué)習(xí)交互式學(xué)習(xí)的優(yōu)點(diǎn),大大提升了交通信號(hào)燈周期調(diào)整的效率,由某個(gè)路口的當(dāng)前擁堵級(jí)別和紅綠燈信號(hào)燈時(shí)間比調(diào)整來驗(yàn)證擁堵情況是否有所緩解,以此往復(fù)不斷優(yōu)化得到最佳的紅綠燈時(shí)間比,再利用生成式對(duì)抗網(wǎng)絡(luò)的啟發(fā)自博弈思想實(shí)現(xiàn)對(duì)Q學(xué)習(xí)的有限時(shí)間最佳訓(xùn)練,實(shí)現(xiàn)局部交通優(yōu)化,最終得到最優(yōu)調(diào)整方案,從而提升局部交通優(yōu)化能力。
聲明:
“基于強(qiáng)化學(xué)習(xí)與生成式對(duì)抗網(wǎng)絡(luò)的局部交通優(yōu)化方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)