本申請屬于人工智能技術領域,具體涉及一種信息處理方法、信息處理裝置、計算機可讀介質(zhì)以及電子設備。該方法包括:根據(jù)信息展示請求獲取由多個候選信息組成的候選信息集合,候選信息包括根據(jù)資源付出量競爭展示機會的競爭展示信息以及具有約定展示數(shù)量要求的約定展示信息;根據(jù)資源付出量確定各個競爭展示信息的信息排序分數(shù),信息排序分數(shù)用于表示候選信息的展示優(yōu)先級;通過策略網(wǎng)絡模型對約定展示信息進行分數(shù)預測處理,得到各個約定展示信息的信息排序分數(shù);策略網(wǎng)絡模型是基于多個并行的模型訓練進程訓練得到的強化學習模型;根據(jù)信息排序分數(shù)在候選信息集合中選取待展示的目標信息。該方法可以提高信息處理效率和網(wǎng)絡資源利用率。
聲明:
“信息處理方法、裝置、計算機可讀介質(zhì)及電子設備” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術所有人。
我是此專利(論文)的發(fā)明人(作者)