機器學習簡明教程---基于Python語言實現(xiàn)
定 價:48 元
- 作者:高延增 侯躍恩 羅志堅
- 出版時間:2024/9/1
- ISBN:9787111761006
- 出 版 社:機械工業(yè)出版社
- 中圖法分類:TP181
- 頁碼:
- 紙張:膠版紙
- 版次:
- 開本:16開
本書圖文并茂、深入淺出地介紹了機器學習算法所需的數(shù)學、Python語言編程基礎(chǔ)知識,以及回歸模型、K 近鄰、K 均值、決策樹、弱學習器集成、人工神經(jīng)網(wǎng)絡(luò)、深度學習等常用的機器學習算法。全書共10 章,每章習題中都配套了實驗練習環(huán)節(jié),實驗內(nèi)容包括Python 開發(fā)環(huán)境配置、機器學習算法的實際應(yīng)用等,所有實驗都配有Jupyter 的Python 代碼,從而使讀者既能掌握算法理論原理,又能進行實際應(yīng)用。
本書適合作為普通高等院校本科或研究生階段的人工智能、機器學習、數(shù)據(jù)挖掘等課程的教材,也適合作為自學的參考書。
本書遵循教指委相關(guān)指導(dǎo)文件和高等院校學生學習規(guī)律編寫而成。踐行四新理念,融入思政元素,注重理論與實踐相結(jié)合。
前言
2023年伊始,OpenAI研發(fā)的聊天機器人程序ChatGPT迅速走紅,它能夠像真人一樣理解人類的語言,并與人類進行交流,甚至能完成郵件、代碼、文案的撰寫以及專業(yè)文獻的翻譯等任務(wù),繼2016年3月AlphaGo以4∶1的成績戰(zhàn)勝當時的圍棋世界冠軍、職業(yè)九段棋手李世石之后,人工智能又一次引起了人們的廣泛關(guān)注。街頭巷尾都在談?wù)撊斯ぶ悄,更多的人開始篤信人工智能最終會在各個領(lǐng)域超越人類智能。對于人工智能是否能超越甚至取代人類智能這一問題,我們無法給出準確預(yù)測,但毋庸置疑的是人工智能將會在各個領(lǐng)域承擔越來越重要的角色。
人工智能時代已經(jīng)來臨,而智能時代的弄潮兒屬于少數(shù)能熟練掌握機器學習技術(shù)的人。因此,在各類本科、研究生層次的各專業(yè)中增設(shè)機器學習課程已成為眾多高校教學管理人員的共識。
在此背景下,本書作者根據(jù)多年的工作和學習經(jīng)驗,融合各種公開發(fā)表的參考資料,將機器學習中基礎(chǔ)的、常用的一些常識、算法、工程實踐經(jīng)驗歸納整理、編寫成本書。
本書共10章,第1章首先通過一個電影推薦的案例引導(dǎo)讀者開啟對機器學習的理解,然后介紹機器學習的相關(guān)概念。此外,本章還概要介紹了機器學習應(yīng)用于生產(chǎn)場景中的一般流程,使讀者在后續(xù)的算法學習過程中思考對應(yīng)的應(yīng)用場景;最后介紹了本書所用到的Python編程開發(fā)環(huán)境的配置。
第2章概要地介紹機器學習中常用的一些數(shù)學基礎(chǔ)知識、Python編程語言基礎(chǔ)知識,內(nèi)容包括線性代數(shù)、概率與統(tǒng)計的基礎(chǔ)知識,以及Python編程語言及其常用工具包的基礎(chǔ)知識。
第3章介紹回歸模型。首先介紹模型的一般概念,然后分別介紹線性回歸和邏輯回歸;貧w模型是機器學習模型的基礎(chǔ),簡單易用且易于解釋。
第4章介紹基于距離的算法,包括K近鄰的分類算法和K均值的聚類算法。本章首先從距離的一般概念講起,然后講述常用的數(shù)值向量距離和布爾向量距離,并很自然地過渡到基于距離的K近鄰算法和K均值算法。
第5章介紹決策樹算法。從決策樹的一般概念切入,然后介紹信息熵、信息增益的概念,以此引出決策樹的一般生長過程。在此基礎(chǔ)上,引入實際中常用的ID3、C4.5、CART算法。
第6章講解弱學習器集成算法。首先從思想、原理層面講解3種常用的弱學習器集成方法:裝袋法、提升法、堆疊法。然后引出本章重點,即在各種數(shù)據(jù)處理大賽中大放異彩的XGBoost算法。
第7章介紹支持向量機。本章內(nèi)容包括線性支持向量機、非線性支持向量機等。
第8章講解人工神經(jīng)網(wǎng)絡(luò)。本章重點介紹神經(jīng)元模型的算法原理、多層神經(jīng)網(wǎng)絡(luò)的模型求解算法(梯度下降法)原理。
第9章在第8章的基礎(chǔ)上介紹卷積神經(jīng)網(wǎng)絡(luò)。本章內(nèi)容包括人類視覺系統(tǒng)對卷積神經(jīng)網(wǎng)絡(luò)的啟發(fā),卷積、池化的運算過程,以及幾種常用卷積網(wǎng)絡(luò)架構(gòu)。
第10章介紹了用于處理時間序列的網(wǎng)絡(luò)。本章以序列信號為引子,引出循環(huán)神經(jīng)網(wǎng)絡(luò)如何讓神經(jīng)網(wǎng)絡(luò)有了“記憶”,在此基礎(chǔ)上詳細介紹了長短時記憶網(wǎng)絡(luò)的原理和應(yīng)用方法。
本書在多數(shù)章都配有對應(yīng)的應(yīng)用案例來加深讀者的理解,案例源碼可以從本書二維碼或配套的電子資源中獲得。案例代碼使用Python作為開發(fā)語言、在VS Code中使用Jupyter進行編碼,代碼中加入了詳細注釋。
本書由嘉應(yīng)學院的高延增、侯躍恩、羅志堅共同編著完成,編著工作受到嘉應(yīng)學院2022年度校級質(zhì)量工程和2023年廣東省教改課題建設(shè)項目的資助。本書編寫的過程中還得到了很多朋友和同事的幫助,在此表示感謝。此外,除書中注明的參考文獻外,還引用了很多網(wǎng)上公開發(fā)布的視頻和文字資料,如吳恩達、李沐、李宏毅等眾多人工智能領(lǐng)域?qū)<以诰W(wǎng)絡(luò)平臺上發(fā)布的各種詳盡的學習資料,為本書的編寫提供了很大的幫助,在此對資料的發(fā)布者表示衷心感謝。
由于作者水平有限,書中難免有疏漏、錯誤之處,懇請讀者批評指正。讀者在使用本書的過程中遇到的任何問題可以通過作者的微信個人公眾號(genbotter)和作者聯(lián)系。
作者
高等院校教師
目錄
前言
第1章概述
1.1理解機器學習
1.2一些相關(guān)的概念
1.3機器學習的發(fā)展
1.4機器學習開發(fā)的準備工作
1.5本章小結(jié)
1.6習題
第2章基礎(chǔ)知識
2.1線性代數(shù)
2.2概率與統(tǒng)計
2.3優(yōu)化
2.4Python編程基礎(chǔ)
2.5本章小結(jié)
2.6習題
第3章回歸分析
3.1模型
3.2線性回歸模型應(yīng)用
3.3邏輯回歸
3.4本章小結(jié)
3.5習題
第4章基于距離的算法
4.1分類與聚類的區(qū)別
4.2距離度量問題
4.3K近鄰算法
4.4K均值聚類算法
4.5本章小結(jié)
4.6習題
第5章決策樹
5.1初識決策樹
5.2信息熵與信息增益
5.3決策樹
5.4CART
5.5本章小結(jié)
5.6習題
第6章弱學習器集成算法
6.13種常用的弱學習器集成方法
6.2AdaBoost算法與GBDT算法
6.3XGBoost算法
6.4本章小結(jié)
6.5習題
第7章支持向量機
7.1支持向量機的相關(guān)概念
7.2線性支持向量機
7.3非線性支持向量機
7.4軟間隔
7.5應(yīng)用案例
7.6本章小結(jié)
7.7習題
第8章人工神經(jīng)網(wǎng)絡(luò)
8.1人工智能的概念
8.2神經(jīng)元模型
8.3多層神經(jīng)網(wǎng)絡(luò)
8.4應(yīng)用案例
8.5本章小結(jié)
8.6習題
第9章卷積神經(jīng)網(wǎng)絡(luò)
9.1人類視覺系統(tǒng)的啟發(fā)
9.2CNN算法原理
9.3CNN應(yīng)用
9.4本章小結(jié)
9.5習題
第10章用于處理時間序列的網(wǎng)絡(luò)
10.1序列
10.2循環(huán)神經(jīng)網(wǎng)絡(luò)
10.3長短時記憶網(wǎng)絡(luò)
10.4本章小結(jié)
10.5習題
參考文獻