大數(shù)據(jù)實(shí)訓(xùn)案例——電信用戶行為分析(Scala版)
定 價(jià):45 元
- 作者:林子雨
- 出版時(shí)間:2019/5/1
- ISBN:9787115501233
- 出 版 社:人民郵電出版社
- 中圖法分類:F626-39
- 頁碼:179
- 紙張:
- 版次:01
- 開本:16開
本書詳細(xì)介紹了一個(gè)大數(shù)據(jù)應(yīng)用案例——電信用戶行為分析,案例涉及數(shù)據(jù)預(yù)處理、數(shù)據(jù)存儲(chǔ)與管理、數(shù)據(jù)分析和數(shù)據(jù)可視化等流程,涵蓋Linux、MySQL、Hadoop、Spark、IntelliJ IDEA、Spring等系統(tǒng)和軟件的安裝與使用方法。案例采用的編程語言是Scala和Java。
本書是廈門大學(xué)作者團(tuán)隊(duì)長期經(jīng)驗(yàn)總結(jié)的結(jié)晶。本書是在廈門大學(xué)《大數(shù)據(jù)技術(shù)原理與應(yīng)用》入門級(jí)大數(shù)據(jù)教材的基礎(chǔ)之上編寫的。為了確保教程質(zhì)量,在編著出版紙質(zhì)教材之前,實(shí)驗(yàn)室已經(jīng)于2016年10月通過實(shí)驗(yàn)室官網(wǎng)免費(fèi)發(fā)布共享了簡化版的Spark在線教程和相關(guān)教學(xué)資源,同時(shí),該在線教程也已經(jīng)用于廈門大學(xué)計(jì)算機(jī)科學(xué)系研究生的大數(shù)據(jù)課程教學(xué),并成為全國高校大數(shù)據(jù)課程教師培訓(xùn)交流班的授課內(nèi)容。實(shí)驗(yàn)室根據(jù)讀者對(duì)在線Spark教程的大量反饋意見以及教學(xué)實(shí)踐中發(fā)現(xiàn)的問題,對(duì)Spark在線教程進(jìn)行了多次修正和完善,所有這些前期準(zhǔn)備工作,都為紙質(zhì)教材的編著出版打下了堅(jiān)實(shí)的基礎(chǔ)。
林子雨(1978-),男,博士,廈門大學(xué)計(jì)算機(jī)科學(xué)系助理教授,廈門大學(xué)云計(jì)算與大數(shù)據(jù)研究中心創(chuàng)始成員,廈門大學(xué)數(shù)據(jù)庫實(shí)驗(yàn)室負(fù)責(zé)人,中國計(jì)算機(jī)學(xué)會(huì)數(shù)據(jù)庫專委會(huì)委員,中國計(jì)算機(jī)學(xué)會(huì)信息系統(tǒng)專委會(huì)委員。于2001年獲得福州大學(xué)水利水電專業(yè)學(xué)士學(xué)位,2005年獲得廈門大學(xué)計(jì)算機(jī)專業(yè)碩士學(xué)位,2009年獲得北京大學(xué)計(jì)算機(jī)專業(yè)博士學(xué)位。中國高校首個(gè)“數(shù)字教師”提出者和建設(shè)者(http://www.cs.xmu.edu.cn/linziyu),2009年至今,“數(shù)字教師”大平臺(tái)累計(jì)向網(wǎng)絡(luò)免費(fèi)發(fā)布超過500萬字高價(jià)值的教學(xué)和科研資料,累計(jì)網(wǎng)絡(luò)訪問量超過500萬次。 主要研究方向?yàn)閿?shù)據(jù)庫、數(shù)據(jù)倉庫、數(shù)據(jù)挖掘和大數(shù)據(jù),發(fā)表期刊和會(huì)議學(xué)術(shù)論文多篇,并作為課題負(fù)責(zé)人主持了1項(xiàng)國家自然科學(xué)基金、1項(xiàng)福建省自然科學(xué)基金項(xiàng)目和1項(xiàng)福建省教改課題。曾作為志愿者翻譯了Google Spanner、BigTable和《Architecture of a Database System》等大量英文學(xué)術(shù)資料,與廣大網(wǎng)友分享,深受歡迎。2013年開始在廈門大學(xué)開設(shè)大數(shù)據(jù)課程,并因在教學(xué)領(lǐng)域的突出貢獻(xiàn)和學(xué)生的認(rèn)可,成為2013年度和2017年度廈門大學(xué)教學(xué)類獎(jiǎng)教金獲得者。獲得2017年福建省精品在線開放課程、2018年廈門大學(xué)高等教育教學(xué)成果特等獎(jiǎng)、2018年福建省高等教育教學(xué)成果二等獎(jiǎng)。 主講課程:《大數(shù)據(jù)處理技術(shù)》。 個(gè)人主頁:http://www.cs.xmu.edu.cn/linziyu。 E-mail: ziyulin@xmu.edu.cn。 數(shù)據(jù)庫實(shí)驗(yàn)室網(wǎng)站:http://dblab.xmu.edu.cn。 建設(shè)了高校大數(shù)據(jù)課程公共服務(wù)平臺(tái)(http://dblab.xmu.edu.cn/post/bigdata-teaching- platform/),成為全國高校大數(shù)據(jù)教學(xué)知名品牌。平臺(tái)為教師教學(xué)和學(xué)生學(xué)習(xí)大數(shù)據(jù)課程提供包括教學(xué)大綱、講義PPT、學(xué)習(xí)指南、備課指南、實(shí)驗(yàn)指南、上機(jī)習(xí)題、授課視頻、技術(shù)資料等全方位、一站式免費(fèi)服務(wù),平臺(tái)年訪問量超過100萬次,同時(shí)提供面向高校的大數(shù)據(jù)實(shí)驗(yàn)平臺(tái)建設(shè)方案和大數(shù)據(jù)課程師資培訓(xùn)服務(wù)。
第1章 案例概述 1
1.1 案例目的 1
1.2 適用對(duì)象 1
1.3 時(shí)間安排 1
1.4 預(yù)備知識(shí) 2
1.5 硬件要求 2
1.6 軟件工具 2
1.7 數(shù)據(jù)集 3
1.8 案例任務(wù) 3
1.9 實(shí)驗(yàn)步驟 4
1.10 在線資源 6
1.10.1 在線資源一覽表 6
1.10.2 下載專區(qū) 6
1.10.3 先修課程 7
1.10.4 大數(shù)據(jù)課程公共服務(wù)平臺(tái) 7
1.11 本章小結(jié) 8
第2章 大數(shù)據(jù)實(shí)驗(yàn)環(huán)境搭建 9
2.1 Linux系統(tǒng)及相關(guān)軟件使用方法 9
2.1.1 Shell 10
2.1.2 root用戶 10
2.1.3 創(chuàng)建普通用戶 10
2.1.4 sudo命令 11
2.1.5 常用的Linux系統(tǒng)命令 11
2.1.6 文件解壓縮 12
2.1.7 常用的目錄 12
2.1.8 目錄的權(quán)限 13
2.1.9 更新APT 13
2.1.10 切換中英文輸入法 14
2.1.11 vim編輯器的安裝和使用方法 15
2.2 JDK的安裝 15
2.3 Scala的安裝 16
2.4 Hadoop的安裝和基本使用方法 17
2.4.1 安裝Hadoop前的準(zhǔn)備工作 17
2.4.2 安裝Hadoop 19
2.4.3 HDFS操作常用Shell命令 22
2.5 Spark的安裝和基本使用方法 24
2.5.1 下載安裝文件 24
2.5.2 配置相關(guān)文件 25
2.5.3 Spark和Hadoop的交互 25
2.5.4 在spark-shell中運(yùn)行代碼 26
2.6 MySQL數(shù)據(jù)庫的安裝和基本
使用方法 28
2.6.1 安裝MySQL 28
2.6.2 MySQL常用操作 31
2.7 安裝Tomcat 33
2.7.1 安裝方式的選擇 33
2.7.2 下載安裝文件 33
2.7.3 安裝和啟動(dòng)Tomcat 34
2.8 本章小結(jié) 35
第3章 IntelliJ IDEA開發(fā)工具的
安裝和使用方法 36
3.1 下載和安裝IDEA 36
3.2 下載Scala插件安裝包 36
3.3 啟動(dòng)IDEA 37
3.4 為IDEA安裝Scala插件 40
3.5 配置項(xiàng)目的JDK 44
3.6 使用IDEA開發(fā)WordCount程序 45
3.6.1 創(chuàng)建一個(gè)新項(xiàng)目WordCount 46
3.6.2 為WordCount項(xiàng)目添加Scala
框架支持 48
3.6.3 設(shè)置項(xiàng)目目錄 51
3.6.4 新建Scala代碼文件 53
3.6.5 配置pom.xml文件 55
3.6.6 更新Maven的依賴文件 57
3.6.7 運(yùn)行WordCount程序 57
3.6.8 打包WordCount程序生成
JAR包 59
3.6.9 把JAR包提交到Spark中運(yùn)行 63
3.7 本章小結(jié) 63
第4章 使用Spring、Spring
MVC和MyBatis開發(fā)
網(wǎng)頁應(yīng)用 64
4.1 MVC模型 64
4.2 Spring框架 65
4.3 Spring MVC框架 66
4.3.1 網(wǎng)頁開發(fā)中的“請(qǐng)求-響應(yīng)”
模型 66
4.3.2 采用Spring MVC框架后的
網(wǎng)頁請(qǐng)求處理過程 67
4.4 MyBatis 68
4.5 一個(gè)簡單的網(wǎng)頁應(yīng)用開發(fā)實(shí)例 69
4.5.1 新建項(xiàng)目 69
4.5.2 配置pom.xml文件 71
4.5.3 設(shè)置項(xiàng)目目錄 74
4.5.4 編寫代碼文件 75
4.5.5 對(duì)項(xiàng)目文件進(jìn)行編譯打包 77
4.5.6 把WebDemo.war發(fā)布到
Tomcat中 81
4.5.7 實(shí)現(xiàn)Spring MVC和
Spring的整合 83
4.5.8 實(shí)現(xiàn)Spring、Spring MVC和
MyBatis三者的融合 86
4.5.9 把后端數(shù)據(jù)提交給網(wǎng)頁顯示 93
4.6 在IntelliJ IDEA中使用Tomcat
調(diào)試網(wǎng)頁程序 96
4.7 本章小結(jié) 104
第5章 使用ECharts制作
可視化圖表 105
5.1 ECharts簡介 105
5.2 ECharts圖表制作方法 105
5.2.1 下載ECharts 105
5.2.2 在HTML中引入ECharts 106
5.2.3 繪制一個(gè)簡單的圖表 106
5.2.4 導(dǎo)出圖片 107
5.3 可視化圖表制作實(shí)例 109
5.3.1 快速制作圖表方法 109
5.3.2 實(shí)例1:柱狀圖 110
5.3.3 實(shí)例2:餅狀圖 113
5.4 本章小結(jié) 117
第6章 電信用戶行為分析
實(shí)現(xiàn)過程 118
6.1 數(shù)據(jù)分析整體過程 118
6.2 本地?cái)?shù)據(jù)集上傳到HDFS 119
6.2.1 數(shù)據(jù)集下載 119
6.2.2 把數(shù)據(jù)集上傳到HDFS 119
6.3 在MySQL中創(chuàng)建數(shù)據(jù)庫 120
6.3.1 啟動(dòng)進(jìn)入MySQL Shell環(huán)境 120
6.3.2 創(chuàng)建一個(gè)數(shù)據(jù)庫 120
6.3.3 創(chuàng)建一個(gè)數(shù)據(jù)匯總表 120
6.3.4 創(chuàng)建一個(gè)數(shù)據(jù)明細(xì)表 121
6.3.5 創(chuàng)建一個(gè)數(shù)據(jù)原始明細(xì)表 121
6.3.6 創(chuàng)建一個(gè)區(qū)域維表 121
6.3.7 創(chuàng)建一個(gè)渠道維表 121
6.3.8 創(chuàng)建一個(gè)請(qǐng)求類型維表 122
6.3.9 創(chuàng)建五個(gè)視圖 122
6.3.10 添加MySQL數(shù)據(jù)庫
驅(qū)動(dòng)程序JAR包 123
6.4 開發(fā)Spark程序分析用戶行為 123
6.4.1 新建項(xiàng)目 124
6.4.2 設(shè)置依賴包 125
6.4.3 設(shè)置項(xiàng)目目錄 127
6.4.4 新建Scala代碼文件 127
6.4.5 配置pom.xml文件 133
6.4.6 在IDEA中運(yùn)行程序 136
6.4.7 生成應(yīng)用程序JAR包 138
6.4.8 使用spark-submit命令
運(yùn)行程序 142
6.5 使用Spring MVC框架進(jìn)行
數(shù)據(jù)可視化分析 144
6.5.1 新建項(xiàng)目 144
6.5.2 配置pom.xml文件 145
6.5.3 設(shè)置項(xiàng)目目錄 148
6.5.4 編寫代碼文件 150
6.5.5 生成應(yīng)用程序JAR包 173
6.5.6 把網(wǎng)頁應(yīng)用部署到Tomcat
服務(wù)器中 175
6.6 本章小結(jié) 178
參考文獻(xiàn) 179