Hadoop大數(shù)據(jù)技術(shù)基礎(chǔ)及應(yīng)用
定 價:69 元
叢書名:高等教育規(guī)劃教材
- 作者:王斌
- 出版時間:2019/3/1
- ISBN:9787111620167
- 出 版 社:機械工業(yè)出版社
- 中圖法分類:TP274
- 頁碼:356
- 紙張:
- 版次:
- 開本:16開
本書系統(tǒng)介紹了Hadoop生態(tài)系統(tǒng)的核心開發(fā)技術(shù),包括:Hadoop大數(shù)據(jù)技術(shù)概述、Hadoop開發(fā)及運行環(huán)境搭建、HDFS分布式文件系統(tǒng)、MapReduce分布式計算技術(shù)框架、Hadoop的文件I/O以及YARN資源管理器、Zookeeper分布式協(xié)調(diào)服務(wù)、Hadoop分布式集群搭建與管理、Hive 數(shù)據(jù)倉庫和HBase分布式數(shù)據(jù)庫、Hadoop生系系統(tǒng)常用開發(fā)技術(shù),并通過廣電收視率數(shù)據(jù)統(tǒng)計分析和視頻網(wǎng)站爬蟲系統(tǒng)開發(fā)兩個實踐項目,詳細(xì)直觀地介紹了大數(shù)據(jù)項目的開發(fā)思路及流程。 本書通俗易懂、結(jié)構(gòu)清晰,內(nèi)容層層遞進,理論與實踐相結(jié)合,通過大量的實戰(zhàn)案例,引導(dǎo)讀者逐步深入學(xué)習(xí),從而全面掌握Hadoop生態(tài)系統(tǒng)相關(guān)技術(shù)。
本書既可作為高等院校大學(xué)本?朴嬎銠C專業(yè)的教學(xué)用書,也可作為相關(guān)技術(shù)人員的參考用書。本書配套授課電子課件,需要的教師可登錄www.cmpedu.com免費注冊,審核通過后下載,或聯(lián)系編輯索。≦Q:2966938356,電話:010-88379739)。
目 錄
前言
第1章 Hadoop大數(shù)據(jù)技術(shù)概述
1.1 Hadoop 的前世今生
1.2 Hadoop生態(tài)系統(tǒng)簡介
1.3 Hadoop優(yōu)勢及應(yīng)用領(lǐng)域
1.4 Hadoop與云計算
1.5 Hadoop與Spark
1.6 Hadoop 與傳統(tǒng)關(guān)系型數(shù)據(jù)庫
第2章 Hadoop開發(fā)及運行環(huán)境搭建
2.1 Hadoop集群環(huán)境搭建概述
2.2 Hadoop偽分布式集群環(huán)境搭建
2.3 搭建MyEclipse開發(fā)環(huán)境
第3章 HDFS分布式文件系統(tǒng)
3.1 HDFS體系結(jié)構(gòu)詳解
3.2 HDFS的Shell操作
3.3 HDFS的Java API操作
3.4 HDFS的新特性——HA
3.5 實戰(zhàn):小文件合并程序編寫及運行
第4章 MapReduce分布式計算框架
4.1 初識MapReduce
4.2 MapReduce編程模型
4.3 MapReduce運行框架
4.4 實戰(zhàn):統(tǒng)計相同字母組成的不同單詞
第5章 Hadoop的文件I/O
5.1 Hadoop文件I/O概述
5.2 Hadoop文件I/O的數(shù)據(jù)完整性
5.3 Hadoop文件的序列化
5.4 Hadoop數(shù)據(jù)的解壓縮
5.5* 基于文件的數(shù)據(jù)結(jié)構(gòu)
5.6* 實戰(zhàn):Hadoop源碼編譯及Snappy壓縮的配置使用
第6章 YARN資源管理器
6.1 初識YARN
6.2 YARN基本架構(gòu)
6.3 YARN的工作原理
6.4 YARN的容錯性
6.5 YARN HA
第7章* Zookeeper分布式協(xié)調(diào)服務(wù)
7.1 Zookeeper概述
7.2 Zookeeper安裝配置
7.3 Zookeeper 服務(wù)
7.4 Zookeeper的應(yīng)用
7.5 實戰(zhàn):模擬實現(xiàn)集群配置信息的訂閱與發(fā)布
第8章 Hadoop分布式集群搭建與管理
8.1 物理集群準(zhǔn)備
8.2 集群規(guī)劃
8.3 集群安裝前的準(zhǔn)備
8.4 Hadoop相關(guān)軟件安裝
8.5 Hadoop集群環(huán)境搭建
8.6 集群啟停
8.7* 主機維護操作
8.8* 集群節(jié)點動態(tài)增加與刪除
8.9* 集群運維技巧
第9章 Hive數(shù)據(jù)倉庫
9.1 初識Hive
9.2 Hive的原理及架構(gòu)
9.3 Hive的安裝部署
9.4 Hive數(shù)據(jù)庫相關(guān)操作
9.5 Hive數(shù)據(jù)表相關(guān)的操作
9.6 Hive的數(shù)據(jù)操作語言DML
9.7 Hive的數(shù)據(jù)查詢語言DQL
9.8 實戰(zhàn):通過Hive分析股票走勢規(guī)律
第10章 HBase分布式數(shù)據(jù)庫
10.1 HBase 概述
10.2 HBase 數(shù)據(jù)模型
10.3 HBase核心概念
10.4 HBase集群安裝部署
10.5 HBase Shell 工具
10.6 HBase Java客戶端
10.7 實戰(zhàn):MapReduce批量操作HBase
第11章 Hadoop生態(tài)系統(tǒng)常用開發(fā)技術(shù)
11.1 Sqoop數(shù)據(jù)導(dǎo)入導(dǎo)出工具
11.2 Flume日志采集系統(tǒng)
11.3 Kafka分布式消息系統(tǒng)
11.4* ElasticSearch全文檢索工具
11.5* Storm流式計算框架
11.6* Spark內(nèi)存計算框架
第12章 項目實踐:廣電收視率數(shù)據(jù)統(tǒng)計分析
第13章* 項目實踐:視頻網(wǎng)站爬蟲系統(tǒng)開發(fā)
參考文獻