大數(shù)據(jù)技術(shù)原理與操作應(yīng)用
定 價(jià):48 元
叢書名:高職高專計(jì)算機(jī)系列教材
- 作者:王倩,閻紅 編
- 出版時(shí)間:2020/8/1
- ISBN:9787568923576
- 出 版 社:重慶大學(xué)出版社
- 中圖法分類:TP274
- 頁(yè)碼:263
- 紙張:膠版紙
- 版次:1
- 開(kāi)本:16開(kāi)
《大數(shù)據(jù)技術(shù)原理與操作應(yīng)用》圍繞Hadoop生態(tài)圈相關(guān)組件系統(tǒng)介紹大數(shù)據(jù)架構(gòu)。全書共10章,其中,第1、2章主要介紹Hadoop的概述以及如何搭建Hadoop的集群;第3章~第5章介紹分布式文件系統(tǒng)(HDFS)、分布式計(jì)算框架(Ma-pReduce)以及分布式協(xié)調(diào)服務(wù);第6章介紹Hadoop 2.0新特性,包含YARN和高可用集群的原理。第7章-第9章主要介紹Hadoop生態(tài)圈的相關(guān)輔助系統(tǒng),包含Hive、Flume、Sqoop;第10章是綜合案例的開(kāi)發(fā),利用Hadoop的相關(guān)組件進(jìn)行項(xiàng)目的開(kāi)發(fā),同時(shí)加深對(duì)Hadoop生態(tài)圈的技術(shù)的理解。
《大數(shù)據(jù)技術(shù)原理與操作應(yīng)用》可以作為高職高專計(jì)算機(jī)相關(guān)專業(yè)、信息系統(tǒng)相關(guān)專業(yè)、數(shù)據(jù)科學(xué)相關(guān)專業(yè)的大數(shù)據(jù)平臺(tái)課程教材,也可供一線技術(shù)人員參考。
信息社會(huì)最重要的特征之一,就是每時(shí)每刻都在產(chǎn)生著海量的數(shù)據(jù)。海量的生產(chǎn)數(shù)據(jù)、處理數(shù)據(jù)和應(yīng)用數(shù)據(jù),將伴隨著物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、數(shù)字家庭、社會(huì)化網(wǎng)絡(luò)等新一代信息技術(shù)應(yīng)用不斷地增長(zhǎng)。未來(lái)在智慧城市、電信、金融、衛(wèi)生、電子商務(wù)以及電子政務(wù)等領(lǐng)域?qū)⑹谴髷?shù)據(jù)技術(shù)與應(yīng)用的最佳行業(yè)的沃土,對(duì)大數(shù)據(jù)的處理和分析成為新一代信息技術(shù)的融合發(fā)展的核心支撐。
本書的章節(jié)設(shè)置是為適應(yīng)大數(shù)據(jù)開(kāi)發(fā)應(yīng)用產(chǎn)業(yè)對(duì)高素質(zhì)技術(shù)技能型人才的職業(yè)需求,覆蓋大數(shù)據(jù)行業(yè)典型工作流程崗位,包括大數(shù)據(jù)平臺(tái)與相關(guān)工具配置、數(shù)據(jù)處理與計(jì)算、數(shù)據(jù)分析與可視化展現(xiàn)等。綜合項(xiàng)目章節(jié)選取典型的大數(shù)據(jù)真實(shí)業(yè)務(wù)分析應(yīng)用場(chǎng)景,圍繞對(duì)Hadoop集群的安裝配置、管理及MapReduce計(jì)算,并包含大數(shù)據(jù)處理相關(guān)算法應(yīng)用與軟件工具運(yùn)用,從而激發(fā)學(xué)生對(duì)大數(shù)據(jù)知識(shí)和技術(shù)的學(xué)習(xí)興趣,提升學(xué)生職業(yè)素養(yǎng)和職業(yè)技能,努力為我國(guó)大數(shù)據(jù)應(yīng)用產(chǎn)業(yè)發(fā)展儲(chǔ)備及輸送人才。
本書理念先進(jìn)、內(nèi)容新穎,并以注重實(shí)用、提高技能為目的,通過(guò)大量的實(shí)例和實(shí)訓(xùn)內(nèi)容,幫助讀者提高應(yīng)用技能,本書基于VMware workstation 14平臺(tái)和Linux Centos 7操作系統(tǒng)為基礎(chǔ)搭建Hadoop環(huán)境,除了講解基礎(chǔ)原理,更是在操作細(xì)節(jié)、使用交互等方面給予了詳細(xì)的介紹。
全書由王倩進(jìn)行整體規(guī)劃和內(nèi)容組織。王倩、閻紅負(fù)責(zé)內(nèi)容統(tǒng)稿并擔(dān)任主編,由鄭麗、安厚霖、崔俊鵬、潘旭等參與編寫。
全書的第1章、第3章、第6章由天津職業(yè)大學(xué)安厚霖編寫;第2章、第4章由天津職業(yè)大學(xué)鄭麗編寫;第7章、第9章由天津中德應(yīng)用技術(shù)大學(xué)崔俊鵬編寫;第5章、第10章由天津職業(yè)大學(xué)王倩編寫;第8章由天津職業(yè)大學(xué)閻紅編寫;全書的習(xí)題由國(guó)網(wǎng)天津市電力公司檢修公司潘旭編寫。
由于編者水平有限、經(jīng)驗(yàn)不足,書中難免有錯(cuò)誤與疏漏,懇請(qǐng)廣大讀者和同行批評(píng)指正。
第1章 初識(shí)Hadoop
1.1 大數(shù)據(jù)的介紹
1.2 Hadoop的介紹
習(xí)題1
第2章 Hadoop集群構(gòu)建
2.1 Linux系統(tǒng)安裝
2.2 Linux系統(tǒng)網(wǎng)絡(luò)配置
2.3 創(chuàng)建普通用戶
2.4 構(gòu)建Hadoop完全分布式集群環(huán)境
2.5 Hadoop平臺(tái)運(yùn)行及測(cè)試
習(xí)題2
第3章 HDFS分布式文件系統(tǒng)
3.1 Hadoop的文件系統(tǒng)
3.2 HDFS的簡(jiǎn)介
3.3 HDFS的架構(gòu)及原理
3.4 HDFS的Shell操作
3.5 HDFS的Java API操作
習(xí)題3
第4章 MapReduce分布式計(jì)算系統(tǒng)
4.1 MapReduce的介紹
4.2 MapReduce運(yùn)行機(jī)制
4.3 案例:使用MapReduce實(shí)現(xiàn)反向索引
習(xí)題4
第5章 ZooKeeper分布式協(xié)調(diào)服務(wù)
5.1 認(rèn)識(shí)ZooKeeper
5.2 ZooKeeper的數(shù)據(jù)模型
5.3 ZooKeeper的Watch機(jī)制
5.4 ZooKeeper的選舉機(jī)制
5.5 ZooKeeper分布式集群部署
5.6 ZooKeeper的Shell操作
5.7 ZooKeeper Java API操作
5.8 ZooKeeper應(yīng)用場(chǎng)景
習(xí)題5
第6章 Hadoop2.O新特性
6.1 Hadoop 2.0的改進(jìn)與提升
6.2 YARN體系結(jié)構(gòu)
6.3 YARN工作流程
6.4 HDFS HA的搭建方法
習(xí)題6
第7章 Hive數(shù)據(jù)倉(cāng)庫(kù)
7.1 Hive的介紹
7.2 Hive的安裝部署
7.3 Hive的基本操作
習(xí)題7
第8章 日志采集系統(tǒng)
8.1 Flume的介紹
8.2 Flume基本使用方法
8.3 Flume采集方案配置說(shuō)明
8.4 Flume的可靠性保證
8.5 Flume攔截器
8.6 案例——日志采集
習(xí)題8
第9章 Sqoop數(shù)據(jù)遷移
9.1 Sqoop的介紹
9.2 Sqoop數(shù)據(jù)導(dǎo)入
9.3 Sqoop數(shù)據(jù)導(dǎo)出
習(xí)題9
第10章 綜合項(xiàng)目案例
10.1 最高氣溫統(tǒng)計(jì)案例
10.2 電子商務(wù)離線數(shù)據(jù)統(tǒng)計(jì)案例
參考文獻(xiàn)