本書通過Excel示例介紹常用的機器學習算法和數(shù)據(jù)挖掘技術。許多機器學習任務的目的是找到數(shù)據(jù)中的隱藏模式。Excel能夠清楚地展示機器學習建模過程的每一步及中間結果,讓你不僅知其然,還知其所以然。第1章解釋用Excel學習機器學習的益處。第2~12章分別介紹線性回歸、k均值聚類、線性判別分析、交叉驗證、logistic回歸、k最近鄰、樸素貝葉斯分類、決策樹、關聯(lián)分析、神經(jīng)網(wǎng)絡、文本挖掘。第13章總結全書內(nèi)容,并為讀者指出繼續(xù)學習的方向。
1.在Excel當中分步講解機器學習方法,有效理解機器學習的底層原理;
2.數(shù)據(jù)挖掘的基礎知識與Excel實例相結合,內(nèi)容清晰,邏輯順暢;
3.清楚地明晰機器學習的模型構建過程,幫助你在不寫代碼、不記憶復雜數(shù)學公式的情況下,牢固地掌握機器學習的核心概念。
周紅博士是美國康涅狄格州圣約瑟夫大學計算機科學和數(shù)學教授,也曾在硅谷從事軟件開發(fā)工作。作為經(jīng)驗豐富的教育工作者,他意識到利用Excel分步講解機器學習方法和數(shù)據(jù)挖掘技巧的獨特優(yōu)勢,并在實際教學過程中成功地引入Excel作為演示工具。這種教學方法頗受學生歡迎。
第 1章 Excel和數(shù)據(jù)挖掘 1
1.1 為什么選擇Excel 1
1.2 Excel 預備技巧 4
1.2.1 公式 5
1.2.2 自動填充或復制 5
1.2.3 絕對引用 7
1.2.4 選擇性粘貼和值粘貼 9
1.2.5 IF 函數(shù) 11
1.3 復習要點 17
第 2章 線性回歸 18
2.1 一般性理解 18
2.2 通過Excel學習線性回歸 22
2.3 通過Excel學習多元線性回歸 25
2.4 復習要點 28
第3章 k均值聚類 29
3.1 一般性理解 29
3.2 通過Excel學習k均值聚類 30
3.3 復習要點 39
第4章 線性判別分析 40
4.1 一般性理解 40
4.2 規(guī)劃求解 42
4.3 通過Excel學習線性判別分析 44
4.4 復習要點 53
第5章 交叉驗證和ROC曲線分析 54
5.1 對交叉驗證的一般性理解 54
5.2 通過Excel學習交叉驗證 55
5.3 對ROC曲線分析的一般性理解 59
5.4 通過Excel學習ROC曲線分析 60
5.5 復習要點 65
第6章 logistic回歸 66
6.1 一般性理解 66
6.2 通過Excel 學習logistic 回歸 67
6.3 復習要點 73
第7章 k最近鄰 74
7.1 一般性理解 74
7.2 通過Excel 學習k 最近鄰 75
7.2.1 實驗1 75
7.2.2 實驗2 78
7.2.3 實驗3 82
7.2.4 實驗4 85
7.3 復習要點 87
第8章 樸素貝葉斯分類 88
8.1 一般性理解 88
8.2 通過Excel 學習樸素貝葉斯分類 90
8.2.1 練習1 91
8.2.2 練習2 94
8.3 復習要點 100
第9章 決策樹 101
9.1 一般性理解 102
9.2 通過Excel 學習決策樹 105
9.2.1 開始學習 105
9.2.2 更好的方法 115
9.2.3 應用模型 118
9.3 復習要點 120
第 10章 關聯(lián)分析 121
10.1 一般性理解 122
10.2 通過Excel 學習關聯(lián)分析 124
10.3 復習要點 131
第 11章 人工神經(jīng)網(wǎng)絡 132
11.1 一般性理解 132
11.2 通過Excel學習人工神經(jīng)網(wǎng)絡 134
11.2.1 實驗1 134
11.2.2 實驗2 143
11.3 復習要點 152
第 12章 文本挖掘 153
12.1 一般性理解 153
12.2 通過Excel學習文本挖掘 155
12.3 復習要點 168
第 13章 后記 169