本說明書實施例提供一種激勵決策模型的運動引導方法,訓練健康狀態(tài)預測模型,預測用戶的健康狀態(tài)上升空間,并確定當前階段的健康狀態(tài)上升空間,獲取樣本用戶的動作信息和對應的健康狀態(tài)變化數(shù)據(jù),構造激勵函數(shù),利用樣本用戶的動作信息和對應的健康狀態(tài)變化數(shù)據(jù)對激勵函數(shù)進行強化學習,生成動作空間,結合強化學習出的激勵函數(shù)構造動作決策模型,在動作空間中進行搜索生成動作策略,計算其激勵函數(shù)值,并進行迭代,直至計算出的激勵函數(shù)值滿足預設條件,輸出動作策略,持續(xù)更新引導用戶運動并進行動作識別,通過利用激勵函數(shù)值進行迭代的方式可得到全局最優(yōu)的動作策略,提高了與用戶的匹配度。
聲明:
“激勵決策模型的運動引導方法、裝置和電子設備” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)