Python計算機視覺和自然語言處理 開發(fā)機器人應(yīng)用系統(tǒng)
定 價:89.9 元
叢書名:計算機視覺
- 作者:[西]阿爾瓦羅·莫雷納·阿爾貝羅拉(álvaro Morena Alberola) [西]貢薩洛·莫利納·加列戈(Gonzalo Molina Gallego) [西]烏奈·加
- 出版時間:2021/6/1
- ISBN:9787115560629
- 出 版 社:人民郵電出版社
- 中圖法分類:TP311.56
- 頁碼:254
- 紙張:
- 版次:01
- 開本:16開
機器人是人工智能時代的重要產(chǎn)物,為人類的工作和生活提供了非常多的助力。對于智能機器人而言,視覺識別能力和對話能力是非常重要的兩個方面,本書就是基于這兩個技術(shù)展開介紹,并通過一系列的編程案例和實踐項目,引導(dǎo)讀者高效掌握機器人的開發(fā)技巧。
本書基于Python語言進(jìn)行講解,結(jié)合機器人操作系統(tǒng)(ROS)平臺給出了豐富多樣的機器人開發(fā)方案。本書立足于機器人的視覺和語言處理,通過OpenCV、自然語言處理、循環(huán)神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)等技術(shù)提高機器人的視覺識別能力和對話能力。全書包括多個練習(xí)和項目,通過知識點和編程實踐相結(jié)合的方式,快速帶領(lǐng)讀者掌握實用的機器人開發(fā)技術(shù)。
本書適合機器人或智能軟硬件研發(fā)領(lǐng)域的工程師閱讀,也適合高校人工智能相關(guān)專業(yè)的師生閱讀。
1.技術(shù)點熱:用Python講解自然語言處理技術(shù)和計算機視覺技術(shù);;
2.作者知名:多名作者聯(lián)合編寫,繼承了AI在機器人領(lǐng)域應(yīng)用的權(quán)威經(jīng)驗;
3.內(nèi)容豐富:用ROS開發(fā)更智能的機器人系統(tǒng),用NLP技術(shù)和OpenCV技術(shù)讓機器人更加智能;
4.立足實踐:書中包含大量練習(xí)與項目,幫助讀者快速掌握機器人開發(fā)技術(shù),全方位提升讀者的動手能力和研發(fā)能力。
5.配套資源:配套的代碼資源包和彩色圖片包,讓你邊學(xué)邊對照,學(xué)習(xí)效率更高。
阿爾瓦羅·莫雷納·阿爾貝羅拉(álvaro Morena Alberola)是一名熱愛機器人學(xué)和人工智能的計算機工程師,目前從事軟件開發(fā)工作。álvaro對基于人工視覺的人工智能(AI)核心部分非常感興趣,并且喜歡嘗試新技術(shù)和先進(jìn)的工具。對他來說,機器人可以讓人類的生活更輕松,并且可以幫助人們完成他們自己無法完成的任務(wù)。
貢薩洛·莫利納·加列戈(Gonzalo Molina Gallego)是一名計算機科學(xué)專業(yè)的碩士,主修人工智能和自然語言處理。他構(gòu)建過基于文本的對話系統(tǒng)和對話代理,擅長提供方法論層面的建議。目前,他致力于研究跨領(lǐng)域?qū)υ捪到y(tǒng)方向的新技術(shù)。Gonzalo認(rèn)為,未來的用戶界面是基于對話的。
烏奈·加雷·馬埃斯特雷(Unai Garay Maestre)是一名計算機科學(xué)專業(yè)的碩士,主修人工智能和計算機視覺。在為2018年的CIARP大會貢獻(xiàn)的一篇論文中,他提出了一種使用變分自編碼器進(jìn)行數(shù)據(jù)增強的新方法。他同時是一名機器學(xué)習(xí)工程師,使用深度神經(jīng)網(wǎng)絡(luò)處理圖像。
第 1章 機器人學(xué)基礎(chǔ) 1
1.1 簡介 1
1.2 機器人學(xué)的歷史 2
1.3 人工智能 3
1.3.1 自然語言處理簡介 4
1.3.2 計算機視覺簡介 5
1.3.3 機器人的類型 5
1.3.4 機器人的硬件和軟件 6
1.4 機器人定位 8
1.4.1 練習(xí)1:計算機器人的位置 10
1.4.2 如何進(jìn)行機器人開發(fā) 12
1.4.3 練習(xí)2:使用Python計算輪子走過的距離 12
1.4.4 練習(xí)3:使用Python計算機器人的最終位置 13
1.4.5 項目1:使用Python和測距法進(jìn)行機器人定位 15
1.5 小結(jié) 16
第 2章 計算機視覺 17
2.1 簡介 17
2.2 計算機視覺基本算法 18
2.2.1 圖像相關(guān)術(shù)語 18
2.2.2 OpenCV 19
2.2.3 閾值化 19
2.2.4 練習(xí)4:對圖像應(yīng)用各種閾值化操作 21
2.2.5 形態(tài)學(xué)變換 25
2.2.6 練習(xí)5:對圖像應(yīng)用形態(tài)學(xué)變換 27
2.2.7 模糊(平滑) 31
2.2.8 練習(xí)6:對圖像應(yīng)用模糊方法 32
2.2.9 練習(xí)7:加載圖像并應(yīng)用所學(xué)的各種方法 34
2.3 機器學(xué)習(xí)簡介 38
2.3.1 決策樹和提升方法 38
2.3.2 練習(xí)8:使用決策樹、隨機森林和AdaBoost進(jìn)行數(shù)字
預(yù)測 41
2.3.3 人工神經(jīng)網(wǎng)絡(luò) 47
2.3.4 練習(xí)9:構(gòu)建第 一個神經(jīng)網(wǎng)絡(luò) 51
2.3.5 項目2:對Fashion-MNIST數(shù)據(jù)集中的10種衣物進(jìn)行分類 54
2.4 小結(jié) 56
第3章 自然語言處理 57
3.1 簡介 57
3.1.1 自然語言處理 58
3.1.2 自然語言處理的兩個部分 59
3.1.3 NLP的各層次 60
3.2 Python中的NLP 61
3.2.1 自然語言工具包(NLTK) 61
3.2.2 練習(xí)10:NLTK入門 62
3.2.3 spaCy 65
3.2.4 練習(xí)11:spaCy入門 67
3.3 主題建模 70
3.3.1 詞頻-逆文檔頻率(TF-IDF) 70
3.3.2 潛在語義分析(LSA) 71
3.3.3 練習(xí)12:使用Python進(jìn)行主題建!72
3.3.4 項目3:處理一個語料庫 75
3.4 語言建!76
3.4.1 語言模型簡介 76
3.4.2 二元模型 77
3.4.3 N元模型 77
3.4.4 計算概率 78
3.4.5 練習(xí)13:創(chuàng)建一個二元模型 80
3.5 小結(jié) 83
第4章 NLP神經(jīng)網(wǎng)絡(luò) 84
4.1 簡介 84
4.2 循環(huán)神經(jīng)網(wǎng)絡(luò) 86
4.2.1 循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)簡介 87
4.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)原理 87
4.2.3 RNN架構(gòu) 89
4.2.4 長距離依賴問題 89
4.2.5 練習(xí)14:使用RNN預(yù)測房價 90
4.2.6 長短期記憶網(wǎng)絡(luò) 93
4.2.7 練習(xí)15:預(yù)測數(shù)學(xué)函數(shù)的下一個解 94
4.3 神經(jīng)語言模型 100
4.3.1 神經(jīng)語言模型簡介 100
4.3.2 RNN語言模型 102
4.3.3 練習(xí)16:對一個小語料庫進(jìn)行編碼 103
4.3.4 RNN的輸入維度 107
4.3.5 項目4:預(yù)測字符序列中的下一個字符 109
4.4 小結(jié) 111
第5章 計算機視覺中的卷積神經(jīng)網(wǎng)絡(luò) 112
5.1 簡介 112
5.2 CNN基礎(chǔ) 113
5.3 構(gòu)建第 一個CNN 118
練習(xí)17:構(gòu)建一個CNN 119
5.4 改進(jìn)模型的方法:數(shù)據(jù)增強 124
5.4.1 練習(xí)18:利用數(shù)據(jù)增強改進(jìn)模型 125
5.4.2 項目5:使用數(shù)據(jù)增強來正確對花朵圖像進(jìn)行分類 134
5.5 最先進(jìn)的模型:遷移學(xué)習(xí) 137
練習(xí)19:基于遷移學(xué)習(xí)對鈔票進(jìn)行分類 139
5.6 小結(jié) 144
第6章 機器人操作系統(tǒng)(ROS) 146
6.1 簡介 146
6.2 ROS基本概念 147
6.3 ROS基本命令 148
6.4 安裝和配置 149
6.5 Catkin工作空間和軟件包 149
6.6 發(fā)布者和訂閱者 150
6.6.1 練習(xí)20:編寫簡單的發(fā)布者和訂閱者 151
6.6.2 練習(xí)21:編寫較復(fù)雜的發(fā)布者和訂閱者 154
6.7 模擬器 159
6.7.1 練習(xí)22:Turtlebot配置 159
6.7.2 練習(xí)23:模擬器和傳感器 161
6.7.3 項目6:模擬器和傳感器 163
6.8 小結(jié) 164
第7章 構(gòu)建基于文本的對話系統(tǒng)(聊天機器人) 165
7.1 簡介 165
7.2 向量空間中的詞表示 166
7.2.1 詞嵌入 166
7.2.2 余弦相似度 167
7.2.3 Word2Vec 168
7.2.4 Word2Vec的問題 169
7.2.5 Gensim 169
7.2.6 練習(xí)24:創(chuàng)建詞嵌入 169
7.2.7 全局向量(GloVe) 173
7.2.8 練習(xí)25:使用預(yù)訓(xùn)練的GloVe模型觀察詞語在平面上的分布 174
7.3 對話系統(tǒng) 179
7.3.1 聊天機器人的開發(fā)工具 180
7.3.2 對話代理的類型 180
7.3.3 創(chuàng)建基于文本的對話系統(tǒng) 182
7.3.4 練習(xí)26:創(chuàng)建第 一個對話代理 184
7.3.5 項目7:創(chuàng)建一個用來控制機器人的對話代理 189
7.4 小結(jié) 191
第8章 利用基于CNN的物體識別來指導(dǎo)機器人 193
8.1 簡介 193
8.2 多物體識別和檢測 194
8.2.1 練習(xí)27:構(gòu)建第 一個多物體檢測和識別系統(tǒng) 195
8.2.2 ImageAI 200
8.3 視頻中的多物體識別和檢測 202
項目8:視頻中的多物體檢測和識別 206
8.4 小結(jié) 206
第9章 機器人的計算機視覺 208
9.1 簡介 208
9.2 Darknet 209
Darknet基礎(chǔ)安裝 209
9.3 YOLO 210
9.3.1 使用YOLO進(jìn)行預(yù)測 211
9.3.2 在攝像頭上使用YOLO 215
9.3.3 練習(xí)28:YOLO編程 215
9.3.4 練習(xí)29:在ROS中集成YOLO 219
9.3.5 項目9:機器人保安 223
9.4 小結(jié) 224
附錄 本書項目概覽 225