本書是人工智能領(lǐng)域的經(jīng)典書籍,新版做了全面修訂,增加了關(guān)于機器學(xué)習的內(nèi)容,并更新了代碼示例和練習。本書主要討論智能體(agent)的基本概念和體系結(jié)構(gòu),從計算的角度介紹相關(guān)的規(guī)劃、學(xué)習、推理、協(xié)商、交互機制等理論,基于自主送貨機器人、診斷助手、智能輔導(dǎo)系統(tǒng)和交易智能體四個原型應(yīng)用,在一個連貫的框架下研究智能體的設(shè)計、構(gòu)建和實現(xiàn),并從十個維度考慮設(shè)計空間的復(fù)雜性。
[加]大衛(wèi)·L.普爾(David L.Poole),不列顛哥倫比亞大學(xué)計算機科學(xué)系教授,計算智能實驗室主管。他是加拿大人工智能協(xié)會(CAIAC)和人工智能協(xié)會(AAAI)會士。曾獲CAIAC 2013年終身成就獎,曾任人工智能不確定性協(xié)會(AUAI。
[加]阿蘭·K.麥克沃斯(Alan K.Mackworth),不列顛哥倫比亞大學(xué)計算機科學(xué)系榮休教授。他是CAIAC和AAAI會士,以及加拿大高等研究院(CIFAR)和加拿大學(xué)會(RSC)院士。曾任國際人工智能聯(lián)合會議(IJGAI)、AAAI和CAIA。
黃智瀕,計算機系統(tǒng)結(jié)構(gòu)博士,北京郵電大學(xué)計算機學(xué)院講師。長期從事機器學(xué)大規(guī)模并行計算、GPU加速計算以及三維計算機視覺和深度學(xué)方面的研究。
白鵬,博士,中國航天空氣動力技術(shù)研究院研究員、博士生導(dǎo)師,航天科技集團公司學(xué)術(shù)技術(shù)帶頭人,《空氣動力學(xué)學(xué)報》編委。長期從事飛行器空氣動力學(xué)特性評估與氣體設(shè)計領(lǐng)域的科研工作。曾榮獲部級科步獎(5次)、航天貢獻獎及航天基金獎。獲國家發(fā)明專利20余項,出版學(xué)術(shù)專著2部,在國內(nèi)外學(xué)術(shù)期刊和AIAA等重要國際學(xué)術(shù)會議上文100余篇。
譯者序
前言
致謝
部分 世界中的智能體:什么是智能體?如何創(chuàng)建智能體?
第1章 人工智能與智能體2
1.1 什么是人工智能2
1.1.1 人工智能和自然智能3
1.2 人工智能簡史5
1.2.1 與其他學(xué)科的關(guān)系7
1.3 環(huán)境中的智能體7
1.4 設(shè)計智能體8
1.4.1 設(shè)計時間計算、離線計算和在線計算8
1.4.2 任務(wù)10
1.4.3 定義解決方案11
1.4.4 表示12
1.5 智能體設(shè)計空間14
1.5.1 模塊性14
1.5.2 規(guī)劃視野14
1.5.3 表示15
1.5.4 計算限制16
1.5.5 學(xué)
1.5.6 不確定性18
1.5.7 偏好19
1.5.8 智能體數(shù)量19
1.5.9 交互性20
1.5.10 各維度的相互作用20
1.6 原型應(yīng)用21
1.6.1 自主送貨機器人22
1.6.2 診斷助手24
1.6.3 智能輔導(dǎo)系統(tǒng)25
1.6.4 交易智能體27
1.6.5 智能家居28
1.7 本書概覽29
1.8 回顧29
1.9 參考文獻一步閱讀30
1.10 練
第2章 智能體的體系結(jié)構(gòu)與層次控制32
2.1 智能體32
2.2 智能體系統(tǒng)33
2.2.1 智能能33
2.3 層級控制36
2.4 用推理行動42
2.4.1 智能體建模世界42
2.4.2 知識和行動43
2.4.3 設(shè)計時間計算和離線計算44
2.4.4 在線計算45
2.5 回顧46
2.6 參考文獻一步閱讀46
2.7 練
第二部分 確定性推理、規(guī)劃與學(xué)r/>第3章 搜索解決方案50
3.1 以搜索的方式解決問題50
3.2 狀態(tài)空間51
3.3 圖搜索53
3.3.1 形式化圖搜索53
3.4 通用搜索算法55
3.5 無信息搜索策略57
3.5.1 廣度優(yōu)先搜索57
3.5.2 深度優(yōu)先搜索59
3.5.3 迭代深化62
3.5.4 代價優(yōu)先搜索64
3.6 啟發(fā)式搜索65
3.6.1 A搜索66
3.6.2 設(shè)計啟發(fā)式函數(shù)69
3.7 搜索空間的修剪70
3.7.1 環(huán)修剪70
3.7.2 多路徑修剪70
3.7.3 搜索策略小結(jié)72
3.8 更復(fù)雜的搜索73
3.8.1 分支定界73
3.8.2 搜索的方向75
3.8.3 動態(tài)規(guī)劃77
3.9 回顧79
3.10 參考文獻一步閱讀80
3.11 練
第4章 約束推理83
4.1 可能世界、變量和約束83
4.1.1 變量和世界83
4.1.2 約束86
4.1.3 約束滿足問題87
4.2 生成和測試算法88
4.3 使用搜索求解CSP88
4.4 一致性算法89
4.5 域分割93
4.6 變量消除94
4.7 局部搜索96
4.7.1 迭代98
4.7.2 隨機算法98
4.7.3 局部搜索的變體99
4.7.4 評估隨機算法102
4.7.5 隨機重啟104
4.8 基于種群的方法104
4.9 優(yōu)化器106
4.9.1 系統(tǒng)化的優(yōu)化方法108
4.9.2 用于優(yōu)化的局部搜索110
4.10 回顧111
4.11 參考文獻一步閱讀112
4.12 練2
第5章 命題與推理115
5.1 命題115
5.1.1 命題演算的語法115
5.1.2 命題演算的語義116
5.2 命題約束119
5.2.1 用于一致性算法的子句形式120
5.2.2 在局部搜索中利用命題結(jié)構(gòu)121
5.3 命題確定子句121
5.3.1 問題和答案123
5.3.2 證明124
5.4 知識表示問題129
5.4.1 背景知識和觀察129
5.4.2 查詢用戶130
5.4.3 知識層面的解釋131
5.4.4 知識層面的調(diào)試133
5.5 反證法137
5.5.1 霍恩子句137
5.5.2 假設(shè)與沖突138
5.5.3 基于一致性的診斷139
5.5.4 用假設(shè)和霍恩子行推理140
5.6 完備知識假設(shè)143
5.6.1 非單調(diào)推理145
5.6.2 否定作為失敗的證明過程146
5.7 溯因法148
5.8 因果模型152
5.9 回顧153
5.10 參考文獻一步閱讀153
5.11 練4
第6章 確定性規(guī)劃161
6.1 狀態(tài)、動作、目標的表示161
6.1.1 顯式狀態(tài)空間表示162
6.1.2 STRIPS表示163
6.1.3 基于特征的動作表示164
6.1.4 初始化狀態(tài)和目標166
6.2 前向規(guī)劃166
6.3 回歸規(guī)劃168
6.4 CSP規(guī)劃169
6.4.1 動作特征171
6.5 偏序規(guī)劃173
6.6 回顧175
6.7 參考文獻一步閱讀176
6.8 練6
第7章 有監(jiān)督機器學(xué)9
7.1 學(xué)179
7.2 有監(jiān)督學(xué)1
7.2.1 評估預(yù)測值183
7.2.2 誤差類型187
7.2.3 無輸入特征的點估算189
7.3 有監(jiān)督學(xué)本模型190
7.3.1 學(xué)樹191