任何足夠先進的技術(shù)初看都與魔法無異。
自動駕駛汽車已經(jīng)在很多國家上路,網(wǎng)飛的算法能主動預(yù)測你喜歡的電影,DeepMind的計算機程序通關(guān)了雅達利游戲,AlphaGo在古老的圍棋領(lǐng)域攻克了人類智能的防線。
這一切是如何發(fā)生的?智能機器究竟如何思考?
在這本書中,作者用幾乎人人都能讀懂的語言展示了人工智能領(lǐng)域的前沿成果,深入解讀了感知算法、強化學(xué)習(xí)、智能體、卷積神經(jīng)網(wǎng)絡(luò)、深度語音識別、圖片識別等科技巨頭紛紛擁抱的概念,正是它們讓當(dāng)今的機器如此智能。
DARPA和ImageNet的挑戰(zhàn)賽給未來播撒了怎樣的種子?
網(wǎng)飛的電影推薦為什么如此準(zhǔn)確?
人工智能怎么打DOTA?
AlphaGo除了下圍棋還會做別的嗎?
神經(jīng)網(wǎng)絡(luò)如何做到能聽、能說、能記憶?
我們?yōu)槭裁匆粩嘀圃炷軓?fù)制人類智力和行為的機器?
這本書將為你打開機器學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)的黑匣子,讓你看懂魔法背后的機制。關(guān)于自動駕駛汽車、網(wǎng)飛算法、會玩游戲的人工智能以及AlphaGo,這本書幾乎囊括了你想知道的一切。
1. 這是一本技術(shù)小白和技術(shù)大咖都愛讀的機器學(xué)習(xí)指南。谷歌前工程專家、機器學(xué)習(xí)極客肖恩格里什的重磅作品。
2. 深度神經(jīng)網(wǎng)絡(luò)是新一波人工智能熱潮的推動引擎。圍繞這一前沿工具展開的對話,推動著自動駕駛汽車、網(wǎng)飛的推薦算法、AlphaGo,甚至?xí)駾OTA游戲的人工智能的發(fā)展,任何想要參與這一時代對話的人都應(yīng)該讀讀這本書。
3. 作者用通俗的類比和鼓舞人心的故事,厘清了許多神秘而前衛(wèi)的新概念:感知算法、強化學(xué)習(xí)、卷積神經(jīng)網(wǎng)絡(luò)、深度語音識別、圖片識別等。掌握這些概念,你才能更好地判斷,哪些關(guān)于人工智能的言論值得相信,哪些說得天花亂墜的謬論應(yīng)該被拋棄,這本書將助力你的AI創(chuàng)業(yè)與投資之路。
4. 微軟CTO凱文斯科特親筆作序、谷歌工程總監(jiān)雷庫茲韋爾、美國人工智能協(xié)會院士佩德羅多明戈斯、谷歌研究科學(xué)家凱文墨菲、微軟亞洲研究院副院長潘天佑、馭勢科技CEO吳甘沙鼎力推薦!
推薦序
10多年前,我遇見了肖恩。當(dāng)時我在谷歌領(lǐng)導(dǎo)團隊,負責(zé)開發(fā)為谷歌的搜索廣告業(yè)務(wù)提供支持的許多大型機器學(xué)習(xí)系統(tǒng)。肖恩是我們小組里最頂尖的工程師之一,當(dāng)時他正在研究機器學(xué)習(xí)前沿領(lǐng)域的一系列具有挑戰(zhàn)性的問題。我們一起工作以來,體現(xiàn)在統(tǒng)計機器學(xué)習(xí)技術(shù)中的各類人工智能已經(jīng)從相對難以觸及的神秘技術(shù)、研究人員和高科技公司的專屬領(lǐng)域,發(fā)展成為日益平易近人的、卓有成效的工具和技術(shù),值得每一位軟件開發(fā)人員使用。
目前機器學(xué)習(xí)領(lǐng)域取得的快速進展,在一定程度上是由以下因素推動的:數(shù)據(jù)爆炸,高性能計算機體系結(jié)構(gòu)的復(fù)興,云提供商競相為開發(fā)人員和研究人員構(gòu)建可擴展的人工智能平臺,人們將實時智能嵌入移動設(shè)備、汽車、其他消費電子產(chǎn)品和日益普遍的連接到云端的計算設(shè)備的熱潮。這種快速進步中包括一些驚世駭俗的成就,機器在許多狹窄的領(lǐng)域已經(jīng)接近于或超過了人類的能力,例如在圖像中標(biāo)記物體、識別語音、玩策略游戲以及翻譯語言,但我們?nèi)蕴幱谶@些技術(shù)發(fā)展的初期,擺在我們面前的是長達幾十年的創(chuàng)新和發(fā)現(xiàn)之旅。
對開發(fā)人員和研究人員而言,理解機器學(xué)習(xí)的工作原理是一個明智的職業(yè)選擇。目前,全球的科技巨頭公司對這些技術(shù)的專業(yè)知識都有很高的需求。微軟、亞馬遜、谷歌、蘋果、百度等許多公司都提供應(yīng)用程序接口、工具包和云計算基礎(chǔ)設(shè)施,將機器學(xué)習(xí)的開發(fā)工作交給全世界數(shù)以千萬計的開發(fā)人員。未來幾年,隨著越來越多的應(yīng)用程序包含智能功能,大多數(shù)開發(fā)人員都需要掌握一些機器學(xué)習(xí)技術(shù)。這正是這本書的寶貴價值所在。
這本書誕生自肖恩對了解現(xiàn)代機器學(xué)習(xí)成功之路的渴望。在用清晰易懂的方式描述這些系統(tǒng)的本質(zhì)時,肖恩利用10多年的行業(yè)和學(xué)術(shù)經(jīng)驗解決了機器學(xué)習(xí)帶來的一些最棘手的問題。鑒于機器學(xué)習(xí)系統(tǒng)能夠復(fù)制某些方面的人類智能,等到某個突破點臨近,原本由人類特有的創(chuàng)造詩意詞句的能力或許也會被機器復(fù)制。肖恩對這些技術(shù)嚴(yán)謹(jǐn)實用的描述反映了他在科研戰(zhàn)壕中的歲月,不時令人感到痛苦的反復(fù)試驗讓戰(zhàn)壕中的人們了解到,機器學(xué)習(xí)并不是魔法。如果你知道如何應(yīng)用它,了解它的局限所在,它就是強有力的前沿工具;如果你不知道,它就幾乎一文不值。
肖恩通過列舉現(xiàn)實世界的例子,回避不必要的術(shù)語,使現(xiàn)代機器學(xué)習(xí)的概念變得通俗易懂。這本書假設(shè)讀者在機器學(xué)習(xí)或計算機科學(xué)領(lǐng)域的知識相對較少,因此對更廣泛的受眾而言非常友好。鑒于當(dāng)前圍繞機器學(xué)習(xí)和人工智能的對話頗為活躍,并且這些技術(shù)可能對我們的未來產(chǎn)生影響,任何想要參與這場對話的人都應(yīng)該盡可能地學(xué)習(xí)。由于市場上缺乏對機器學(xué)習(xí)通俗易懂的專業(yè)介紹,這本書將成為引導(dǎo)你理解底層技術(shù)的理想方法,它可以幫助你更好地判斷哪些言論值得相信,哪些說得天花亂墜的謬論應(yīng)該被拋棄。
微軟CTO(首席技術(shù)官)
凱文斯科特(Kevin Scott)
肖恩格里什(Sean Gerrish)
谷歌前工程專家,普林斯頓大學(xué)的機器學(xué)習(xí)博士,機器學(xué)習(xí)極客。
曾在高頻交易機構(gòu)泰莎科技擔(dān)任工程師,并在谷歌擔(dān)任機器學(xué)習(xí)和數(shù)據(jù)科學(xué)團隊的工程專家。
推薦序 IX
前言 XIII
1 自動機的秘密
長笛演奏者 003
今天的自動機 005
鐘擺的擺動007
這本書中的自動機 008
2 自動駕駛汽車:挑戰(zhàn)不可能
沙漠中的百萬美元競賽 015
如何打造自動駕駛汽車 017
規(guī)劃路徑 021
路徑搜索 022
導(dǎo)航025
無人車挑戰(zhàn)賽的獲勝者 028
一場失敗的比賽 031
3 保持在車道內(nèi)行駛:自動駕駛汽車的感知
第二次無人車挑戰(zhàn)賽 035
自動駕駛汽車中的機器學(xué)習(xí) 037
斯坦利的架構(gòu) 038
避開障礙物 040
尋找道路的邊緣 043
開眼看路 045
路徑規(guī)劃 047
斯坦利大腦的各個部分如何相互交流 049
4 在十字路口避讓:自動駕駛汽車的大腦
城市挑戰(zhàn)賽 055
感知抽象 057
比賽 059
老板的高層次推理層 061
攻克交通堵塞 068
三層架構(gòu) 071
對自動駕駛汽車看到的物體進行分類 076
自動駕駛汽車是復(fù)雜的系統(tǒng) 077
自動駕駛汽車的軌跡 078
5 網(wǎng)飛和推薦引擎的挑戰(zhàn)
百萬美元大獎 083
競爭者 084
如何訓(xùn)練分類器 085
比賽的目標(biāo) 089
龐大的評分矩陣 091
矩陣分解 096
第一年結(jié)束 102
6 團隊融合:網(wǎng)飛獎的贏家
縮小競爭者之間的差距 107
第一年末 108
隨時間變化的預(yù)測 111
過度擬合 114
模型混合 115
第二年 119
最后一年 120
賽后 124
7 用獎勵教導(dǎo)計算機
DeepMind玩雅達利游戲 129
強化學(xué)習(xí) 132
教導(dǎo)智能體 134
為智能體編寫程序 36
智能體如何觀察環(huán)境 140
經(jīng)驗金塊 141
用強化學(xué)習(xí)玩雅達利游戲 148
8 如何用神經(jīng)網(wǎng)絡(luò)攻克雅達利游戲
神經(jīng)信息處理系統(tǒng) 153
近似,而非完美 153
用作數(shù)學(xué)函數(shù)的神經(jīng)網(wǎng)絡(luò) 155
雅達利游戲神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu) 161
深入研究神經(jīng)網(wǎng)絡(luò) 170
9 人工神經(jīng)網(wǎng)絡(luò)的世界觀
人工智能的奧秘 175
國際象棋自動機土耳其人 177
神經(jīng)網(wǎng)絡(luò)中的誤導(dǎo) 179
識別圖像中的物體 180
過度擬合 183
ImageNet 185
卷積神經(jīng)網(wǎng)絡(luò) 188
為什么是深度網(wǎng)絡(luò)? 194
數(shù)據(jù)瓶頸 197
10 深入了解深度神經(jīng)網(wǎng)絡(luò)的內(nèi)部秘密
計算機生成圖片 203
壓縮函數(shù) 204
ReLU激活函數(shù) 207
機器人之夢 211
11 能聽、能說、能記憶的神經(jīng)網(wǎng)絡(luò)
對機器而言,理解意味著什么? 221
深度語音識別 222
循環(huán)神經(jīng)網(wǎng)絡(luò) 223
為圖像生成字幕 230
長短時記憶網(wǎng)絡(luò) 233
對抗數(shù)據(jù) 235
12 理解自然語言
宣傳噱頭還是人工智能研究的福音? 239
IBM的沃森 240
攻克《危險邊緣》所遇到的挑戰(zhàn) 241
浩如煙海的知識 242
《危險邊緣》挑戰(zhàn)賽的誕生 245
DeepQA 247
問題分析 249
沃森如何解讀句子 252
13 挖掘《危險邊緣》的最佳答案
地下室基準(zhǔn) 261
生成候選答案 263
查找答案 266
輕量級過濾器 269
證據(jù)檢索 270
評分 274
匯總和排名 277
調(diào)整沃森 281
重新審視DeepQA 282
沃森有智能嗎? 283
14 用蠻力搜索找到好策略
通過搜索玩游戲 289
數(shù)獨 290
樹的大小 294
分支因子 297
游戲中的不確定性 297
克勞德香農(nóng)與信息論 302
評價函數(shù) 303
深藍 308
加入IBM 310
搜索與神經(jīng)網(wǎng)絡(luò) 311
西洋雙陸棋程序 313
搜索的局限 315
15 職業(yè)水平的圍棋
計算機圍棋 319
圍棋 321
通過抽樣走子來建立直覺 324
神之一手 330
蒙特卡洛樹搜索 333
單臂老虎機 337
AlphaGo是否需要如此復(fù)雜 339
AlphaGo的局限 341
16 實時人工智能與《星際爭霸》
構(gòu)建更好的游戲機器人 345
《星際爭霸》與人工智能 346
簡化游戲 348
實用《星際爭霸》機器人 351
OpenAI與《DOTA 2》 354
《星際爭霸》機器人的未來 357
17 50年后或更遙遠的未來
人工智能起起伏伏的發(fā)展過程 363
如何復(fù)制這本書中的成功 364
數(shù)據(jù)的普遍使用 368
下一步去向何方 369
致謝 373
注釋 375