本書以通俗易懂的方式,介紹了大數(shù)據(jù)和人工智能的發(fā)展歷程、應用,Python基本語法、數(shù)據(jù)類型、基本流程控制結構、擴展類庫等內(nèi)容。
全書共分17章,主要講解了大數(shù)據(jù)的概念、產(chǎn)生、發(fā)展、作用等基礎知識;云計算和Hadoop體系結構;大數(shù)據(jù)的采集、預處理、存儲、分析與挖掘、可視化等大數(shù)據(jù)處理流程;大數(shù)據(jù)在國內(nèi)外的應用;人工智能概念、分類、學派、發(fā)展、研究內(nèi)容等基礎知識;主流的機器學習算法;幾種深度學習算法;人工智能應用領域;Python發(fā)展、特點、應用領域、開發(fā)環(huán)境安裝配置及類庫的導入等知識; Python基本語法知識;列表、字典、元組和集合等主要復合數(shù)據(jù)類型;順序、選擇和循環(huán)等三種基本流程控制結構;數(shù)據(jù)的存儲,包括文件和數(shù)據(jù)庫;Python中常用的幾種擴展類庫等內(nèi)容。
本書既適合作為高校各個專業(yè)的人工智能的基礎教材,又可作為自學大數(shù)據(jù)、人工智能人員以及人工智能愛好者的參考讀物。
楊忠寶,長春工程學院計算機學院副教授、基礎教學部主任,《大數(shù)據(jù)與人工智能》課程組負責人。主要研究方向為大數(shù)據(jù)、數(shù)據(jù)庫、人工智能。發(fā)表論文10余篇,其中一篇被EI索引;曾在我社主編出版教材《C語言程序設計教程》等;主持或參與的省部級項目1項、廳局級項目2項。歷年主講的課程包括C語言程序設計、VB語言程序設計、JAVA語言程序設計、大學計算機基礎、網(wǎng)頁設計、計算機網(wǎng)絡、數(shù)據(jù)庫原理、C#程序設計、大數(shù)據(jù)與人工智能等。佘向飛,長春工程學院計算機學院副教授,主要研究方向為軟件工程,大數(shù)據(jù)。發(fā)表論文10余篇,出版著作6部。
目錄
第一部分 大數(shù)據(jù)篇
第 1 章 緒論 3
1.1 大數(shù)據(jù)的定義 3
1.2 大數(shù)據(jù)的產(chǎn)生 4
1.3 大數(shù)據(jù)的來源 5
1.4 大數(shù)據(jù)的特征 6
1.5 大數(shù)據(jù)的作用 8
第 2 章 大數(shù)據(jù)架構 10
2.1 云計算 10
2.1.1 云計算兩大核心功能 11
2.1.2 云計算的典型特征 12
2.1.3 云計算的三種模式 13
2.1.4 云計算的服務方式 14
2.1.5 云計算數(shù)據(jù)中心 14
2.1.6 云計算典型應用 15
2.2 大數(shù)據(jù)架構及關鍵技術 16
2.2.1 大數(shù)據(jù)架構 16
2.2.2 關鍵技術 19
2.3 Hadoop 體系架構 19
第 3 章 大數(shù)據(jù)采集及預處理 32
3.1 大數(shù)據(jù)采集 32
3.2 網(wǎng)絡爬蟲 34
3.3 數(shù)據(jù)預處理 58
3.3.1 數(shù)據(jù)預處理的原因 58
3.3.2 數(shù)據(jù)預處理技術 58
3.4 常用ETL 工具 62
第 4 章 大數(shù)據(jù)存儲 63
4.1 大數(shù)據(jù)存儲概述 64
4.2 大數(shù)據(jù)的存儲設備 65
4.2.1 數(shù)據(jù)存儲設備 65
4.2.2 數(shù)據(jù)存儲模式 67
4.3 數(shù)據(jù)庫和數(shù)據(jù)倉庫 69
4.3.1 傳統(tǒng)數(shù)據(jù)庫 69
4.3.2 大數(shù)據(jù)數(shù)據(jù)庫 71
4.3.3 數(shù)據(jù)倉庫 76
第 5 章 大數(shù)據(jù)分析與挖掘 79
5.1 大數(shù)據(jù)分析 79
5.2 大數(shù)據(jù)分析的步驟與方法 82
5.3 大數(shù)據(jù)挖掘 83
第 6 章 大數(shù)據(jù)可視化 87
6.1 數(shù)據(jù)可視化 88
6.2 大數(shù)據(jù)可視化的方法 89
6.3 大數(shù)據(jù)可視化工具 99
第 7 章 大數(shù)據(jù)應用 105
7.1 國外大數(shù)據(jù)應用 105
7.2 國內(nèi)大數(shù)據(jù)應用 108
第二部分 人工智能篇
第 8 章 人工智能概論 115
8.1 人工智能的概念 116
8.2 人工智能的分類和學派 119
8.2.1 人工智能的分類 119
8.2.2 人工智能的學派 121
8.3 人工智能的發(fā)展 123
8.4 人工智能研究的基本內(nèi)容 128
8.5 當人工智能遇上大數(shù)據(jù) 131
8.6 人工智能引發(fā)的思考 132
第 9 章 機器學習 139
9.1 機器學習概述 140
9.2 機器學習的基本流程 143
9.3 機器學習算法 146
9.4 決策樹分類 154
9.5 邏輯回歸分類 170
9.6 支持向量機 177
9.7 聚類 184
9.8 關聯(lián)規(guī)則 190
9.9 人工神經(jīng)網(wǎng)絡 194
第 10 章 深度學習 222
10.1 深度學習概述 222
10.2 卷積神經(jīng)網(wǎng)絡 225
10.3 循環(huán)神經(jīng)網(wǎng)絡 226
10.4 生成對抗網(wǎng)絡 228
10.5 強化學習 230
10.6 遷移學習 231
10.7 對偶學習 232
第 11 章 人工智能應用 234
11.1 圖像識別與分類 235
11.2 語音識別 237
11.3 人臉識別和情感計算 239
11.4 自動駕駛 241
11.5 智能家居 243
11.6 專家系統(tǒng) 246
11.7 機 器人 248
11.8 自然語言處理 251
11.9 其他 AI 應用 253
第三部分 實踐篇
第 12 章 Python 概述 257
12.1 Python 的發(fā)展簡史 257
12.2 Python 的特點 258
12.3 Python 的應用領域 260
12.4 Python 開發(fā)環(huán)境安裝配置 264
12.4.1 Jupyter Notebook 264
12.4.2 Spyder 266
12.4.3 Anaconda Prompt. 266
12.5 Python 類庫的導入 268
第 13 章 Python 語法基礎 271
13.1 標識符、常量、變量 271
13.2 數(shù)據(jù)類型、運算符 272
13.2.1 數(shù)據(jù)類型 272
13.2.2 運 算符 276
13.3 函數(shù) 282
13.3.1 內(nèi)置函數(shù) 282
13.3.2 用戶自定義函數(shù) 286
第 14 章 列表與字典 288
14.1 列表 288
14.2 字典 296
14.3 元組 298
14.4 集合 301
第 15 章 Python 控制結構 305
15.1 順序結構 305
15.2 選擇結構 306
15.2.1 單分支if 語句 306
15.2.2 雙分支if 語句 307
15.2.3 多分支if 語句 308
15.2.4 if 語句的嵌套 309
15.3 循環(huán)結構 311
15.3.1 while 語句 311
15.3.2 for 語句 313
15.3.3 break 語句和continue語句 316
15.3.4 循環(huán)嵌套 318
15.4 經(jīng)典算法 319
第 16 章 文件與數(shù)據(jù)庫 327
16.1 文件的概念及分類 327
16.2 文件的打開與關閉 329
16.2.1 文件的打開 329
16.2.2 文件的關閉 330
16.3 文件的讀/寫 331
16.3.1 用于文件讀/寫的方法 331
16.3.2 文件讀/寫示例 332
16.4 數(shù)據(jù)庫訪問 335
16.4.1 Access 數(shù)據(jù)庫訪問 335
16.4.2 MySQL 數(shù)據(jù)庫訪問 344
16.4.3 MongoDB 數(shù)據(jù)庫訪問 356
第 17 章 Python 常用類庫 370
17.1 NumPy 庫 371
17.2 Matplotlib 庫 375
17.3 Pandas 庫 382
17.4 Scikit-learn 庫 386
17.5 Keras 庫 386
參考文獻 393