本書為十四五高等職業(yè)教育新形態(tài)一體化教材之一,通過貼近生活的挑橘子一例引出機器學習的概念,并展開介紹了機器學習的完整流程、算法分類以及常用工具等。 本書以項目任務的組織方式,以通俗的情境作為項目導入,制定明確的項目目標,以算法的基本原理為知識導入,然后開始項目實施環(huán)節(jié),以多個實訓任務分別練習算法在解決回歸、分類或聚類問題時的一般流程,最后以習題的形式鞏固所學知識和技能。本書的實訓項目主要包含機器學習中基礎的算法應用,即線性回歸算法、k-近鄰算法、邏輯回歸算法、決策樹算法、聚類算法、樸素貝葉斯算法。 通讀本書,你會了解機器學習解決的是什么問題,目前它應用在我們生活中的哪些場景;跟著本書動手實踐,你會清楚數(shù)據(jù)怎么來、怎么加工,以及模型是什么,怎么訓練與調(diào)用;另外,面對一個實際問題,你能夠有依據(jù)地選擇合適的算法。本書適合作為高等職業(yè)院校人工智能技術應用專業(yè)的教材,也適用于有編程基礎的學生以及對機器學習感興趣且亟需入門的社會工作者。
機器學習領域的著名學者湯姆·米切爾(Tom Mitchell)將機器學習定義為:對于計算機
程序有經(jīng)驗 E、學習任務 T 和性能度量 P,如果計算機程序針對任務 T 的性能 P 隨著經(jīng)驗 E 不
斷增長,就稱這個計算機程序從經(jīng)驗 E 學習。 這一概念對于大多數(shù)人而言確實過于抽象簡潔。
如果其定義為用計算機通過算法來學習數(shù)據(jù)中包含的內(nèi)在規(guī)律和信息,從而獲得新的經(jīng)驗和
知識,以提高計算機的智能性,使計算機面對問題時能夠做出與人類相似的決策,則更加符合
大家對機器學習的認知。
近年來,隨著機器學習向各行各業(yè)的滲透,機器學習算法在普羅大眾中也得到了一定的認
可。 從事相關領域工作的人員提到機器學習,想必都會了解甚至十分熟悉監(jiān)督學習、無監(jiān)督學
習和強化學習這三個分類,對于樸素貝葉斯算法、k-均值算法、回歸算法都耳熟能詳。 然而如
何利用機器學習解決自身領域的問題卻又有些不知如何下手。 面對如依據(jù)天氣、時間等因素推
薦一種合適的通勤工具,或者預測自身體重的變化,抑或分析員工離職情況這類數(shù)據(jù)結構相對
簡單、數(shù)據(jù)來源相對單一的問題時,很多人很難將機器學習的理論和技術應用其中,更不要提
構建符合行業(yè)要求的機器學習算法。
當想進一步深入了解時,發(fā)現(xiàn)需要面對汗牛充棟的理論、公式和編程技術,令人望而
卻步。 如果你也面臨類似的問題,那么本書適合你;本書也適合機器學習零基礎的讀者學習。
本書編者在機器學習高等教育領域辛勤耕耘十余年,此次將自身豐富的教學經(jīng)驗以及較深
厚的理論知識進行融合,并配以生動且貼近生活的應用實例,將機器學習算法的知識體系、應
用場景、實施方式與步驟進行了細致的說明。
本書的緒論向讀者介紹了機器學習的概念、機器學習的應用與分類等基礎知識,同時對本
書代碼實現(xiàn)的核心開源庫 sklearn 進行了說明。 此后各項目分別對應了線性回歸算法、k-近鄰
算法、邏輯回歸算法、決策樹、聚類算法以及樸素貝葉斯算法,在每種算法介紹前通過知識導
入,對背景知識、學習前需要掌握的技術能力進行詳細說明,以方便讀者學習;在正文中通過
生動形象的實例深入淺出地講解不同項目的目標、主要知識點以及編程實現(xiàn)步驟;最后通過習
題的形式鞏固本項目學習成果。
本書注意貫徹落實立德樹人根本任務,堅定文化自信,踐行二十大報告精神,充分體現(xiàn)黨
的二十大報告提出的實施科教興國戰(zhàn)略,強化現(xiàn)代人才建設支撐的精神,落實加強教材
建設和管理新要求。
本書由杜輝、葛鵬、趙瑞豐任主編,王亞楠、王磊、劉明浩任副主編,丁雷、金光浩、汪勝平
參與編寫。 在此,感謝所有在本書的內(nèi)容制作、代碼驗證及編排校對工作中付出辛苦勞動和支
持的同志。 本書配套的相關資源可通過派 Lab人工智能教學實訓平臺(平臺網(wǎng)址:lab.
314ai.com)查看和動手實踐,還可與本書編者聯(lián)系(E-mail:1318475816@ qq.com)。
機器學習技術是一門前景廣闊的新興技術,本書力圖從實用性角度為高職同學打開一條通
往未來世界的通道。
由于編者水平有限,書中難免有不足之處,歡迎廣大讀者予以指正。
編 者
2023 年 6 月