本發(fā)明公開了一種深度強化學(xué)習(xí)指導(dǎo)下基于連續(xù)移動的視覺跟蹤方法及裝置,其中,方法包括:預(yù)訓(xùn)練預(yù)測網(wǎng)絡(luò);根據(jù)預(yù)測網(wǎng)絡(luò)生成多個動作并得到相應(yīng)的獎勵;獲取多個動作的每個動作的Q值,同時更新預(yù)測和生成動作的網(wǎng)絡(luò)。該方法可以將連續(xù)地并且累積地調(diào)整物體的目標(biāo)框,同時動態(tài)地調(diào)整目標(biāo)物體的外觀特征和模型,大大提高魯棒性。
聲明:
“深度強化學(xué)習(xí)指導(dǎo)下基于連續(xù)移動的視覺跟蹤方法及裝置” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)