亚洲国产一级在线观看在3838,人妻自慰流白浆一区二区三区,厕所毛茸茸小便

策略前展、策略迭代與分布式強化學習

定　　價：139 元

叢書名：國際知名大學原版教材——信息技術學科與電氣工程學科系列

當前圖書已被 23 所學校薦購過！

查看明細

作者：[美]德梅萃·P. 博賽卡斯（Dimitri P. Bertsekas）著
出版時間：2022/4/1
ISBN：9787302599388
出版社：清華大學出版社

中圖法分類：TP181
頁碼：500
紙張：
版次：1
開本：

內(nèi)容簡介

本書目的是從作者最近出版的《強化學習預**控制》教科書中更深入地發(fā)展一些方法。特別是，提出了有關涉及多個代理，分區(qū)架構(gòu)和分布式異步計算的系統(tǒng)的新研究。本書還將詳細討論該方法在挑戰(zhàn)離散/組合優(yōu)化問題（例如路由，調(diào)度，分配和混合整數(shù)編程）中的應用，包括在這些情況下使用神經(jīng)網(wǎng)絡近似。

本書可作為計算機科學與技術、控制科學與技術、電子科學與技術等相關領域研究生和高年級本科生的教學參考書，也可供信息、通信、控制、優(yōu)化等領域的科研人員參考。

你還可能感興趣

我要評論