分布式人工智能:基于TensorFlow、RTOS與群體智能體系
定 價:169 元
- 作者:王靜逸
- 出版時間:2020/9/1
- ISBN:9787111665205
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:TP18
- 頁碼:0
- 紙張:
- 版次:
- 開本:16開
本書結(jié)合了分布式計算、大數(shù)據(jù)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等技術(shù),以群體智能為主線,講述了分布式人工智能的原理和應(yīng)用。它介紹了分布式計算的框架技術(shù)、智能核心、分布式體系與架構(gòu)。本書介紹了大數(shù)據(jù)的框架、高速計算、海量存儲;介紹了人工智能的經(jīng)典算法,并且結(jié)合分布式技術(shù),進(jìn)行大規(guī)模分布式架構(gòu)與演進(jìn);介紹了群體智能與博弈,結(jié)合分布式、大數(shù)據(jù)、智能核心,講解了群體智能技術(shù)系統(tǒng)的發(fā)展方向與開發(fā)方式。
本書內(nèi)容通俗易懂,案例豐富,實用性強(qiáng),特別適合分布式、人工智能、大數(shù)據(jù)相關(guān)的入門讀者和進(jìn)階讀者閱讀,也適合游戲開發(fā)、推薦系統(tǒng)、群體智能底層研究者等閱讀。另外,本書也適合作為相關(guān)培訓(xùn)機(jī)構(gòu)的教材使用。
前言
第1篇 基礎(chǔ)概念
第1章 分布式系統(tǒng)簡介2
1.1 什么是分布式系統(tǒng)2
1.2 分布式系統(tǒng)的歷史與未來10
1.3 分布式系統(tǒng)與并行計算13
1.4 分布式系統(tǒng)與邊緣計算17
1.5 分布式與超算系統(tǒng)20
1.6 分布式多智能體21
1.7 單體人工智能22
1.7.1 TensorFlow的分布式方案22
1.7.2 Spark分布式機(jī)器學(xué)習(xí)24
1.7.3 Google聯(lián)合學(xué)習(xí)方案26
1.8 分布式與多人博弈27
1.9 分布式與群體智能決策29
1.10 分布式與群體智能的未來和價值30
1.11 本章小結(jié)31
第2章 分布式智能計算基礎(chǔ)33
2.1 常用的分布式計算框架33
2.2 Spark分布式框架介紹37
2.3 HLA高層聯(lián)邦體系41
2.4 Multi-Agent體系44
2.5 RTI與RTOS分布式計算核心47
2.6 分布式計算的原理和常用方法52
2.6.1 分布式計算規(guī)則52
2.6.2 分布式與同步55
2.6.3 分布式與異步59
2.6.4 處理同步與異步延時64
2.7 計算模型與任務(wù)分發(fā)70
2.8 代理模型與HLA智能體75
2.9 分布式與決策模型79
2.10 底層計算核心RTOS84
2.11 分布式智能計算的價值86
2.12 本章小結(jié)89
第2篇 計算框架
第3章 TensorFlow框架介紹92
3.1 什么是TensorFlow92
3.2 TensorFlow的結(jié)構(gòu)和應(yīng)用概念94
3.3 Graph與并行計算模型99
3.4 Session會話層108
3.5 TensorFlow中的數(shù)據(jù)類型與計算函數(shù)112
3.6 TensorFlow與卷積神經(jīng)網(wǎng)絡(luò)120
3.7 準(zhǔn)備TensorFlow的系統(tǒng)環(huán)境128
3.8 下載和安裝TensorFlow135
3.9 啟動第一個測試程序138
3.10 使用TensorFlow構(gòu)建算法框架148
3.10.1 使用CIFAR-10構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)148
3.10.2 使用RNN構(gòu)建記憶網(wǎng)絡(luò)155
3.10.3 搭建生成對抗網(wǎng)絡(luò)160
3.11 TensorFlow的發(fā)展與價值165
3.12 本章小結(jié)166
第4章 分布式智能計算核心167
4.1 什么是SintolRTOS167
4.2 SintolRTOS支持的組織協(xié)議體系168
4.2.1 HLA高層聯(lián)邦體系168
4.2.2 數(shù)據(jù)分發(fā)服務(wù)171
4.2.3 Multi-Agent體系結(jié)構(gòu)173
4.3 SintolRTOS核心組件和系統(tǒng)架構(gòu)176
4.3.1 Core Soft Plateform178
4.3.2 Open Soft Plateform182
4.4 使用SintolRTOS系統(tǒng)組件的工作環(huán)境183
4.5 下載和安裝SintolRTOS183
4.6 SintolRTOS的分布式RTOSNode節(jié)點原理191
4.7 SintolRTOS的聯(lián)邦模型和文件定義196
4.7.1 FED聯(lián)邦模型文件定義196
4.7.2 IDL主題模型文件定義197
4.7.3 Agent代理模型定義199
4.8 編寫AI聯(lián)邦模型和Agent代理200
4.9 分布式計算層的模型與數(shù)據(jù)204
4.9.1 重構(gòu)聯(lián)邦實體的處理類204
4.9.2 DQN神經(jīng)網(wǎng)絡(luò)與PSintolSDK構(gòu)建計算層208
4.10 SintolRTOS智能計算組織Demo213
4.10.1 Demo分布式聯(lián)邦智能架構(gòu)設(shè)計213
4.10.2 使用UnrealRTOS和CSintolSDK搭建仿真演練場景214
4.10.3 運行UnrealRTOS多智能體進(jìn)行聯(lián)邦對抗217
4.11 SintolRTOS與分布式人工智能的未來219
4.12 本章小結(jié)220
第5章 大數(shù)據(jù)與存儲系統(tǒng)框架221
5.1 什么是大數(shù)據(jù)221
5.2 大數(shù)據(jù)的關(guān)鍵技術(shù)222
5.3 大數(shù)據(jù)與機(jī)器學(xué)習(xí)224
5.4 Hadoop與分布式存儲框架225
5.5 搭建Spark運行環(huán)境228
5.6 Spark、Hadoop與TensorFlow結(jié)合245
5.6.1 分布式的圖像數(shù)據(jù)處理和識別平臺245
5.6.2 分布式機(jī)器學(xué)習(xí)與分布式數(shù)據(jù)平臺252
5.7 分布式大數(shù)據(jù)與機(jī)器學(xué)習(xí)的未來252
5.8 本章小結(jié)253
第3篇 多智能體分布式AI算法
第6章 機(jī)器學(xué)習(xí)算法與分布式改進(jìn)256
6.1 邏輯回歸256
6.2 支持向量機(jī)263
6.3 決策樹271
6.4 分布式多算法結(jié)構(gòu)的決策樹279
6.5 多任務(wù)并行計算算法改進(jìn)281
6.5.1 數(shù)據(jù)并行282
6.5.2 模型并行284
6.6 單體算法與分布式算法的優(yōu)化287
6.6.1 單體算法優(yōu)化287
6.6.2 分布式異步隨機(jī)梯度下降290
6.7 機(jī)器學(xué)習(xí)算法的維數(shù)災(zāi)難293
6.8 深度學(xué)習(xí)的內(nèi)在發(fā)展需求294
6.8.1 解決維數(shù)災(zāi)難295
6.8.2 算法架構(gòu)設(shè)計295
6.8.3 深度學(xué)習(xí)與多任務(wù)學(xué)習(xí)297
6.9 自適應(yīng)學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)算法304
6.9.1 Momentum算法與優(yōu)化305
6.9.2 RMSProp算法與優(yōu)化305
6.9.3 Adam算法與優(yōu)化307
6.10 分布式與機(jī)器學(xué)習(xí)算法規(guī);陌l(fā)展與價值310
6.11 本章小結(jié)312
第7章 生成網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)314
7.1 生成對抗網(wǎng)絡(luò)314
7.2 深度卷積生成對抗網(wǎng)絡(luò)316
7.3 分布式與多智能體對抗算法MADDPG330
7.4 常用的強(qiáng)化學(xué)習(xí)算法結(jié)構(gòu)336
7.5 Q-learning算法337
7.6 Sarsa-lamba算法346
7.6.1 Sarsa算法原理346
7.6.2 Sarsa-lamda算法的改進(jìn)347
7.6.3 算法實現(xiàn)347
7.7 深度Q網(wǎng)絡(luò)349
7.7.1 DQN算法原理349
7.7.2 DQN的模型訓(xùn)練350
7.7.3 訓(xùn)練DQN351
7.7.4 算法實現(xiàn)與分析352
7.8 其他強(qiáng)化學(xué)習(xí)基礎(chǔ)算法354
7.9 強(qiáng)化學(xué)習(xí)算法的發(fā)展與價值356
7.10 本章小結(jié)357
第8章 對抗和群體智能博弈358
8.1 群體智能的歷史358
8.2 博弈矩陣360
8.2.1 博弈矩陣簡介360
8.2.2 博弈的線性規(guī)劃和納什均衡363
8.2.3 博弈的學(xué)習(xí)算法364
8.2.4 WoLF-IGA和WoLF-PHC算法366
8.2.5 分布式博弈矩陣368
8.2.6 學(xué)習(xí)自動機(jī)369
8.2.7 仿真博弈環(huán)境371
8.3 網(wǎng)格博弈375
8.4 多智能體Q-learning算法378
8.5 無限梯度上升380
8.6 EMA Q-learning381
8.7 仿真群智博弈環(huán)境382
8.8 Multi-Agent系統(tǒng)開發(fā)384
8.9 群體智能的發(fā)展與價值416
8.10 本章小結(jié)418
第4篇 分布式AI智能系統(tǒng)開發(fā)實戰(zhàn)
第9章 體驗群體智能對抗仿真環(huán)境420
9.1 群體智能仿真系統(tǒng)環(huán)境介紹420
9.2 導(dǎo)入多人對抗智能和仿真環(huán)境423
9.3 啟動分布式多智能體和仿真環(huán)境432
9.4 啟動人與多智能體進(jìn)行對抗434
9.5 啟動數(shù)據(jù)回放436
9.6 啟動多個智能體集團(tuán)博弈439
9.7 群體博弈仿真系統(tǒng)環(huán)境的代碼模塊441
9.8 本章小結(jié)495
第10章 開發(fā)群體智能仿真對抗系統(tǒng)496
10.1 智能體強(qiáng)化學(xué)習(xí)的算法工程496
10.2 算法框架模塊功能說明497
10.3 訓(xùn)練智能體實現(xiàn)任務(wù)AI交互514
10.4 使用訓(xùn)練好的模型進(jìn)行任務(wù)處理518
10.5 多智能體協(xié)作算法與RTOS結(jié)合523
10.5.1 多智能體協(xié)作算法MADDPG的應(yīng)用523
10.5.2 結(jié)合RTOS實現(xiàn)MADDPG的分布式結(jié)構(gòu)525
10.6 行為狀態(tài)機(jī)與AI結(jié)合529
10.7 分布式群體智能的計算與存儲531
10.8 本章小結(jié)534
后記535