![]() ![]() |
策略前展、策略迭代與分布式強化學習
本書目的是從作者最近出版的《強化學習預**控制》教科書中更深入地發(fā)展一些方法。特別是,提出了有關涉及多個代理,分區(qū)架構(gòu)和分布式異步計算的系統(tǒng)的新研究。本書還將詳細討論該方法在挑戰(zhàn)離散/組合優(yōu)化問題(例如路由,調(diào)度,分配和混合整數(shù)編程)中的應用,包括在這些情況下使用神經(jīng)網(wǎng)絡近似。
本書可作為計算機科學與技術、控制科學與技術、電子科學與技術等相關領域研究生和高年級本科生的教學參考書,也可供信息、通信、控制、優(yōu)化等領域的科研人員參考。
你還可能感興趣
我要評論
|