本書共4章。第1章介紹了人工智能、機器學習、深度學習、強化學習的基本概念。第2章以Q學習為例,重點介紹了強化學習的原理、算法步驟、代碼實現(xiàn)、代碼運行調(diào)試。第3章先對深度學習的幾種常見的類型和原理進行介紹,然后給出了例程和調(diào)試方法。第4章以Q學習中運用神經(jīng)網(wǎng)絡(luò)為例,介紹了深度強化學習的基本原理和方法,同時也給出了例程和調(diào)試方法。
適讀人群 :想要獲得深度學習進階知識、強化學習技術(shù)及其應用實踐的學生、從業(yè)者,特別是立志從事AI相關(guān)行業(yè)的人士
在人工智能的學習熱潮中,深度學習和強化學習無疑是亮眼的兩個明星。掌握深度學習原理,理解強化學習概念,對于能夠在人工智能發(fā)展中立于有利之地的您,無疑是必須且非常重要的!稄娀瘜W習與深度學習:通過C語言模擬》不僅綜合了兩種學習的概念,更重要是給出了多個有趣且生動的案例,為您的學習鋪平了道路。
原書前言
近年來,被稱為“深度學習”的機器學習方法在諸多領(lǐng)域取得了成功。深度學習誕生 之初,在圖像處理領(lǐng)域中為圖像識別率取得歷史性突破做出了非常大的貢獻。隨后,隨著深 度學習的不斷發(fā)展,深度學習不局限于應用在圖像處理領(lǐng)域,在各種各樣的機器學習應用領(lǐng) 域都取得了非常顯著的成果。
在深度學習的成功案例中,有一個基于強化學習的深度學習技術(shù)應用方向。強化學習是 單純從一系列行動的結(jié)果進行行動知識學習的方法。在強化學習中引入深度學習的方法,一 般我們稱為深度強化學習。關(guān)于深度強化學習成功案例的應用報道非常多,例如,通過運用 深度強化學習,計算機能夠在汽車轉(zhuǎn)向盤操控方面獲得超越人類的技能;通過運用深度強化 學習,可以制造出能夠打敗圍棋世界冠軍的AI圍棋棋手等。
本書首先對強化學習和深度學習的基礎(chǔ)知識進行介紹,然后在此基礎(chǔ)上,再對深度強化 學習的原理和機制進行具體說明。同時,本書不僅僅是在概念上的說明,而是對具體算法用 C語言進行了編碼和實現(xiàn),通過實際運行代碼的方式去深入理解每一步的具體處理方法。
最后,本書能夠順利成書,離不開作者在福井大學的教育科研活動中取得的經(jīng)驗。在此 向福井大學的各位教職工和學生表示衷心的感謝。另外,借成書之際,也特別對Ohmsha出 版社的各位編輯表示由衷的感謝。最后,我也要感謝支持我寫作的家人們。
小高知宏
2017年9月
目錄
譯者序
原書前言
第1章 強化學習和深度學習
1.1 機器學習和強化學習
1.1.1 人工智能
1.1.2 機器學習
1.1.3 強化學習
1.2 深度學習
1.2.1 神經(jīng)網(wǎng)絡(luò)
1.2.2 深度學習的出現(xiàn)
1.3 深度強化學習
1.3.1 深度強化學習概述
1.3.2 深度強化學習的實現(xiàn)
1.3.3 基本機器學習系統(tǒng)的搭建實例———例題程序的執(zhí)行方法
第2章 強化學習的實例
2.1 強化學習和Q學習
2.1.1 強化學習的基本思想
2.1.2 Q學習的算法
2.2 Q學習實例
2.2.1 q21.c編程實例
2.2.2 目標探尋問題的學習程序
第3章 深度學習技術(shù)
3.1 實現(xiàn)深度學習的技術(shù)
3.1.1 神經(jīng)細胞的活動和階層型 神經(jīng)網(wǎng)絡(luò)
3.1.2 階層型神經(jīng)網(wǎng)絡(luò)的學習
3.1.3 階層型神經(jīng)網(wǎng)絡(luò)的編程實 例(1):單個神經(jīng)細胞的學習程序nn1.c
3.1.4 階層型神經(jīng)網(wǎng)絡(luò)的編程實 例(2):基于誤差逆?zhèn)鞑シǖ纳窠?jīng)網(wǎng)絡(luò)學習程序nn2.c
3.1.5 階層型神經(jīng)網(wǎng)絡(luò)的編程實 例(3):具有多個輸出的神經(jīng)網(wǎng)絡(luò)學習程序nn3.c
3.2 基于卷積神經(jīng)網(wǎng)絡(luò)的學習
3.2.1 卷積神經(jīng)網(wǎng)絡(luò)的算法
3.2.2 卷積神經(jīng)網(wǎng)絡(luò)的編程實例
第4章 深度強化學習
4.1 基于強化學習和深度學習融合的深度強化學習 1
4.1.1 在Q學習中應用神經(jīng)網(wǎng)絡(luò)
4.1.2 Q學習與神經(jīng)網(wǎng)絡(luò)的融合
4.2 深度強化學習的編程實例
4.2.1 岔路選擇問題的深度強化學 習程序q21dl.c
4.2.2 目標探尋問題的深度強化學 習程序q22dl.c
參考文獻