公開了一種基于多源樣本遷移強化學習的智能加工刀具磨損預測方法,它包括以下步驟:根據(jù)幾種刀具的不同磨損曲線獲取多個源任務及一個目標任務;初始化模型參數(shù)及最大迭代時間;檢測當前刀具的磨損狀態(tài),對磨損數(shù)據(jù)進行特征提取及降維,構(gòu)建加權(quán)極限學習機的訓練樣本集,并訓練加權(quán)極限學習機;執(zhí)行加工動作,觀察當前刀具的磨損狀態(tài),計算各源任務和目標任務之間的狀態(tài)相似度和回報相似度;計算源任務中各樣本屬于目標樣本集的概率;獲取任務相似度,并將固定個數(shù)的樣本從每個源樣本集遷移到目標樣本集;利用基于加權(quán)極限學習機的Q學習機制更新Q值,并將新的刀具磨損數(shù)據(jù)添加到目標樣本集中;構(gòu)建粒子濾波模型的狀態(tài)方程及觀測方程。
聲明:
“基于多源樣本遷移強化學習的智能加工刀具磨損預測方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)