久久看看永久视频,日日狠狠久久偷偷色,亚洲中文字幕在线网,午夜福利院中文字幕

  • <dfn id="vuqxj"><td id="vuqxj"></td></dfn>
  • <dfn id="vuqxj"></dfn>

    1. <div id="vuqxj"><option id="vuqxj"><b id="vuqxj"></b></option></div>
    2. 合肥金星智控科技股份有限公司
      宣傳

      位置:中冶有色 >

      有色技術(shù)頻道 >

      > 化學(xué)分析技術(shù)

      > 協(xié)作多智能體強(qiáng)化學(xué)習(xí)方法

      協(xié)作多智能體強(qiáng)化學(xué)習(xí)方法

      962   編輯:管理員   來源:中冶有色技術(shù)網(wǎng)  
      2023-03-19 07:02:29
      本發(fā)明公開了一種協(xié)作多智能體強(qiáng)化學(xué)習(xí)方法,步驟如下:獲取每個智能體的觀測信息和系統(tǒng)的全局狀態(tài);將獲取的每個智能體的觀測信息傳入深度神經(jīng)網(wǎng)絡(luò)計算得到智能體所有動作的狀態(tài)動作值;利用貪心規(guī)則進(jìn)行動作選擇;將采取的動作對應(yīng)的狀態(tài)動作值和全局觀測信息傳入獎勵高速路網(wǎng)絡(luò)中;獎勵高速路網(wǎng)絡(luò)進(jìn)行信息融合并輸入聯(lián)合的狀態(tài)動作值;利用環(huán)境給出的獎勵信號進(jìn)行梯度的反向傳播并更新神經(jīng)網(wǎng)絡(luò)的參數(shù)從而得到每個智能體的策略模型。本發(fā)明能夠降低多智能體系統(tǒng)訓(xùn)練過程中所需的數(shù)據(jù)量,并適合推廣到大規(guī)模的多智能體系統(tǒng)中。
      聲明:
      “協(xié)作多智能體強(qiáng)化學(xué)習(xí)方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
      我是此專利(論文)的發(fā)明人(作者)
      分享 0
               
      舉報 0
      收藏 0
      反對 0
      點贊 0
      標(biāo)簽:
      化學(xué)分析
      全國熱門有色金屬技術(shù)推薦
      展開更多 +

       

      中冶有色技術(shù)平臺微信公眾號
      了解更多信息請您掃碼關(guān)注官方微信
      中冶有色技術(shù)平臺微信公眾號中冶有色技術(shù)平臺

      最新更新技術(shù)

      報名參會
      更多+

      報告下載

      第二屆中國微細(xì)粒礦物選礦技術(shù)大會
      推廣

      熱門技術(shù)
      更多+

      衡水宏運壓濾機(jī)有限公司
      宣傳
      環(huán)磨科技控股(集團(tuán))有限公司
      宣傳

      發(fā)布

      在線客服

      公眾號

      電話

      頂部
      咨詢電話:
      010-88793500-807
      專利人/作者信息登記