本書探討了AI領(lǐng)域的AI Agent(智能體)和生成式AI的前沿進展,以及這些技術(shù)如何重塑我們的生活和工作方式。本書首先回顧了AI技術(shù)的演變歷程,并強調(diào)了智能體的定義及其在客戶服務(wù)、醫(yī)療健康和制造業(yè)等領(lǐng)域的廣泛應(yīng)用。本書也對智能體與傳統(tǒng)軟件進行了對比,分析了智能體的自主性、適應(yīng)性和協(xié)作能力。生成式AI的崛起也被特別提及,其在藝術(shù)創(chuàng)作、數(shù)據(jù)增強等領(lǐng)域的應(yīng)用被廣泛討論。本書還探討了智能體在多智能體系統(tǒng)中的協(xié)同作用和具身智能的概念,分析了智能體的商業(yè)應(yīng)用,包括企業(yè)級應(yīng)用與任務(wù)規(guī)劃、流程優(yōu)化等,同時也指出了智能體在數(shù)據(jù)隱私、安全和倫理方面面臨的挑戰(zhàn)。最后,本書展望了智能體技術(shù)的未來發(fā)展,包括與其他先進技術(shù)的結(jié)合,認為它們將在更多領(lǐng)域發(fā)揮重要作用,為人類社會的進步做出貢獻。智能體在未來將與每個人的工作和生活都息息相關(guān)。
吳畏(Delta)非凡資本合伙人,中歐EMBA。 2017年,創(chuàng)辦非凡資本,已投資耀途資本、寒武創(chuàng)投、梅花創(chuàng)投、FancyTech、聯(lián)諦科技等數(shù)只創(chuàng)業(yè)投資基金及早期項目,累計投資和服務(wù)的創(chuàng)業(yè)公司達數(shù)百家。 2023年,開始關(guān)注AI應(yīng)用,創(chuàng)辦的非凡產(chǎn)研已經(jīng)成為AI應(yīng)用研究領(lǐng)域國內(nèi)領(lǐng)先的行業(yè)智庫。
第1部分 AI的演進與大模型的興起
第1章 AI的起源與進化 3
1.1 從桌面應(yīng)用到云計算 3
1.1.1 桌面應(yīng)用時代:個人電腦提升個人辦公效率 4
1.1.2 互聯(lián)網(wǎng)應(yīng)用時代:軟件從桌面擴展到網(wǎng)絡(luò) 5
1.1.3 移動應(yīng)用時代:軟件走進生活 6
1.1.4 云計算與SaaS時代:軟件服務(wù)化 7
1.2 從早期萌芽到深度學習 9
1.2.1 早期萌芽時代(20世紀50年代—60年代) 9
1.2.2 知識工程時代(20世紀70年代—80年代中期) 10
1.2.3 統(tǒng)計學習時代
(20世紀80年代末—21世紀10年代) 11
1.2.4 深度學習時代(21世紀10年代至今) 12
第2章 大模型時代的AI 14
2.1 生成式AI的崛起 14
2.1.1 圖像生成 15
2.1.2 文本生成 16
2.1.3 音頻生成 18
2.1.4 生成式AI的發(fā)展歷程 19
2.1.5 應(yīng)用與展望 20
2.1.6 總結(jié) 21
2.2 大模型時代狂飆猛進 22
2.2.1 語言模型的發(fā)展歷程 22
2.2.2 LLM的關(guān)鍵技術(shù) 24
2.2.3 LLM的典型應(yīng)用 26
第2部分 大模型驅(qū)動的智能體
第3章 什么是智能體 31
3.1 智能體的定義與特點 31
3.1.1 智能體的定義 32
3.1.2 智能體的特征 33
3.1.3 智能體的應(yīng)用 34
3.1.4 總結(jié) 35
3.2 智能體與傳統(tǒng)軟件的關(guān)系 36
3.2.1 智能體與傳統(tǒng)軟件的區(qū)別 36
3.2.2 智能體在軟件開發(fā)中扮演的角色 38
3.2.3 智能體與傳統(tǒng)軟件的集成 39
3.2.4 智能體在軟件開發(fā)中的案例 40
3.2.5 總結(jié) 42
3.3 智能體與LLM的關(guān)系 43
3.3.1 回顧LLM的神奇之處 43
3.3.2 智能體與LLM的交互 44
3.3.3 智能體與LLM的合作實例 46
3.3.4 智能體與LLM融合中的技術(shù)挑戰(zhàn) 47
3.3.5 對智能體與LLM合作的展望 48
第4章 智能體的核心技術(shù) 50
4.1 NLP 50
4.1.1 NLP核心技術(shù) 51
4.1.2 倫理、偏見與技術(shù)挑戰(zhàn) 52
4.1.3 NLG 54
4.1.4 多模態(tài)處理和NLP 55
4.1.5 回顧和展望 56
4.2 從ChatGPT到智能體 57
4.2.1 ChatGPT的特點 58
4.2.2 AI和NLP的演進 59
4.2.3 技術(shù)突破與倫理挑戰(zhàn) 60
4.3 智能體的五種超能力 61
4.3.1 記憶 61
4.3.2 規(guī)劃 63
4.3.3 工具使用 64
4.3.4 自主決策 65
4.3.5 推理 67
4.3.6 應(yīng)用展望 69
第3部分 下一代軟件可以不必是軟件
第5章 自然語言帶來交互革命 73
5.1 從圖形用戶界面到自然語言的進化 73
5.1.1 交互界面的進化 73
5.1.2 圖形用戶界面 74
5.1.3 自然語言交互 75
5.1.4 會話界面興起 77
5.1.5 交互界面的未來 78
5.2 如何改變用戶體驗 79
5.2.1 用戶體驗演變 79
5.2.2 自然語言交互崛起 80
5.2.3 未來展望 81
第6章 高度自動化帶來生產(chǎn)力革命 83
6.1 人機協(xié)同的方法和框架 83
6.1.1 人機協(xié)同的重要性 83
6.1.2 人機協(xié)同的核心目標 84
6.1.3 人機協(xié)同的方法和框架 85
6.1.4 人機協(xié)同的典型案例 86
6.1.5 生產(chǎn)力革命 87
6.1.6 未來展望 89
6.2 企業(yè)級應(yīng)用與任務(wù)規(guī)劃 90
6.2.1 企業(yè)級應(yīng)用的需求 90
6.2.2 任務(wù)規(guī)劃的作用 92
6.2.3 企業(yè)如何選擇工具 92
6.2.4 機遇與挑戰(zhàn) 94
6.2.5 未來展望 95
第7章 多智能體系統(tǒng)的未來 96
7.1 單智能體系統(tǒng)與多智能體系統(tǒng)的差異 96
7.1.1 單智能體系統(tǒng)的特點 97
7.1.2 多智能體系統(tǒng)的特點 98
7.1.3 技術(shù)進步與分析和比較 99
7.1.4 對企業(yè)的影響與未來趨勢 101
7.2 模擬真實世界的組織結(jié)構(gòu)與工作流程 102
7.2.1 組織結(jié)構(gòu)模擬 103
7.2.2 工作流程模擬 104
7.2.3 技術(shù)進步與實踐應(yīng)用 106
7.2.4 根據(jù)模擬結(jié)果進行組織結(jié)構(gòu)和工作流程優(yōu)化 107
7.2.5 未來趨勢 108
第4部分 典型案例和商業(yè)應(yīng)用
第8章 斯坦福小鎮(zhèn)項目:生成式智能體的典型案例 113
8.1 實驗背景與目的 113
8.1.1 非凡之旅 113
8.1.2 概念框架 114
8.1.3 核心技術(shù) 116
8.1.4 生成式智能體設(shè)計 119
8.1.5 實驗目的 121
8.2 生成式智能體架構(gòu)設(shè)計 123
8.2.1 基礎(chǔ)架構(gòu) 123
8.2.2 記憶和檢索 124
8.2.3 反思 126
8.2.4 規(guī)劃和反應(yīng) 128
8.2.5 行為和互動 129
8.2.6 用戶參與 130
8.3 對未來的啟示 131
8.3.1 生成式智能的潛力無限 131
8.3.2 生成式智能體的倫理挑戰(zhàn) 134
8.3.3 潛力與倫理并重的未來 135
第9章 自主式智能體的典型案例 137
9.1 AutoGPT:通過自然語言的需求描述執(zhí)行自動化任務(wù) 138
9.1.1 AutoGPT的核心功能 138
9.1.2 AutoGPT的技術(shù)架構(gòu) 139
9.1.3 AutoGPT的應(yīng)用范圍 139
9.1.4 未來展望 140
9.2 BabyAGI:根據(jù)任務(wù)結(jié)果自動創(chuàng)建、排序和執(zhí)行新任務(wù) 141
9.2.1 BabyAGI的核心功能 141
9.2.2 BabyAGI的技術(shù)架構(gòu) 142
9.2.3 未來展望 143
9.3 MetaGPT:重塑生成式AI與軟件開發(fā)界面的
多智能體架構(gòu) 144
9.3.1 MetaGPT的核心功能 144
9.3.2 MetaGPT的安裝和配置 148
9.3.3 石頭、剪刀、布游戲開發(fā)中的實例分析 149
9.3.4 在軟件開發(fā)市場中的競爭地位與競爭優(yōu)勢 150
9.3.5 未來展望 151
9.4 AutoGen:下一代LLM應(yīng)用的啟動器 152
9.4.1 AutoGen的核心功能 152
9.4.2 AutoGen的技術(shù)架構(gòu) 153
9.4.3 AutoGen的應(yīng)用案例 154
9.4.4 AutoGen的核心優(yōu)勢 155
9.4.5 未來展望 156
9.5 ChatDev:重塑軟件開發(fā)的AI群體智能協(xié)作框架 157
9.5.1 基本介紹 157
9.5.2 ChatDev的技術(shù)架構(gòu) 160
9.5.3 ChatDev的實際應(yīng)用 162
9.5.4 ChatDev的優(yōu)勢和挑戰(zhàn) 163
9.5.5未來展望 164
9.6 Camel.AI:引領(lǐng)自主與交流智能體的未來 164
9.6.1 Camel.AI的核心概念 164
9.6.2Camel.AI的技術(shù)架構(gòu) 165
9.6.3 Camel.AI的實際應(yīng)用 168
9.6.4 Camel.AI的實驗和性能評估 170
9.6.5未來展望 171
第5部分 智能體的潛能與機遇
第10章 從智能體到具身智能 175
10.1 具身智能的定義與特點 175
10.1.1 智能體與具身智能的區(qū)別 175
10.1.2 具身智能的核心概念 177
10.1.3 具身認知理論的重要性 178
10.2 感知和解析環(huán)境與自主決策 180
10.2.1 感知和解析環(huán)境的技術(shù) 180
10.2.2 從感知到行動的過程 181
10.2.3 自主決策的重要性 182
10.2.4 交互式學習與決策優(yōu)化 183
10.3 從軟件到硬件的進化 184
10.3.1 軟件的角色與硬件的配合 184
10.3.2 硬件進化對軟件的影響 185
10.3.3 具身智能在硬件設(shè)計中的應(yīng)用 186
10.3.4 軟硬件協(xié)同發(fā)展的未來展望 187
10.4 具身機器人的應(yīng)用場景 188
10.4.1 具身機器人在工業(yè)領(lǐng)域的應(yīng)用 188
10.4.2 具身機器人在醫(yī)療領(lǐng)域的應(yīng)用 189
10.4.3 具身機器人在日常生活中的應(yīng)用 191
10.4.4 具身機器人的發(fā)展趨勢 192
10.5 具身智能研究的挑戰(zhàn)與機遇 193
10.5.1 當前的研究難點與挑戰(zhàn) 193
10.5.2 解決方案與研究方向 194
10.5.3 具身智能對未來社會的影響 196
10.5.4 具身智能的商業(yè)潛力與市場前景 197
10.6 具身智能和核心與未來 198
10.6.1 重新審視智能體的重要性 198
10.6.2 對研究者和實踐者的建議 199
第11章 智能體與未來的關(guān)系 200
11.1 重塑Web3.0格局的可能性 200
11.1.1 Web3.0的定義與特點 200
11.1.2 智能體在Web3.0中的角色 201
11.1.3 智能體在Web3.0中的應(yīng)用案例 203
11.2 智能體在元宇宙里的應(yīng)用 204
11.2.1 元宇宙的定義與發(fā)展 204
11.2.2 元宇宙里的智能體應(yīng)用 205
11.2.3 智能體在元宇宙里的應(yīng)用案例 206
第6部分 展望:安全、發(fā)展、邊界和挑戰(zhàn)
第12章 數(shù)據(jù)治理與社會倫理 211
12.1 數(shù)據(jù)隱私保護與數(shù)據(jù)安全問題 211
12.1.1 數(shù)據(jù)收集與處理的風險 211
12.1.2 數(shù)據(jù)治理的重要性 212
12.2 自主決策與人類的倫理界限 213
12.2.1 自主決策的倫理考量 213
12.2.2 倫理原則與自主AI的選擇 214
12.2.3 決策邊界的確定和調(diào)整 215
第13章 技術(shù)邊界與未來無限 217
13.1 當前技術(shù)的局限性 217
13.1.1 數(shù)據(jù)訪問和數(shù)據(jù)質(zhì)量問題 217
13.1.2 邏輯編程的局限性 218
13.1.3 應(yīng)用領(lǐng)域的多方面挑戰(zhàn) 219
13.1.4 決策過程中的偏見問題 220
13.1.5 處理復雜任務(wù)和理解人類意圖的局限 221
13.2 技術(shù)的發(fā)展趨勢 222
13.2.1 技術(shù)不斷進步引領(lǐng)未來 222
13.2.2 數(shù)據(jù)科學與AI技術(shù)的進步 224
13.2.3 與其他先進技術(shù)的結(jié)合 225