Hadoop生態(tài)體系項目實戰(zhàn)
定 價:58 元
叢書名:高等職業(yè)院;诠ぷ鬟^程項目式系列教材 , 企業(yè)級卓越人才培養(yǎng)解決方案“十三五”規(guī)劃教材
- 作者:天津濱海迅騰科技集團有限公司 編
- 出版時間:2019/8/1
- ISBN:9787561864760
- 出 版 社:天津大學出版社
- 中圖法分類:TP274
- 頁碼:217
- 紙張:膠版紙
- 版次:1
- 開本:16開
大數(shù)據(jù)時代的來臨在無數(shù)技術變革的同時,也在悄無聲息地改變著各行各業(yè)。隨著大數(shù)據(jù)技術的發(fā)展和傳統(tǒng)技術的革新,醫(yī)療、交通、金融、電商等多個行業(yè)已經在使用大數(shù)據(jù)技術進行海量數(shù)據(jù)的處理,如疾病預防、出行規(guī)劃、股票預測、行為分析等。《Hadoop生態(tài)體系項目實戰(zhàn)》為用戶行為日志分析的實現(xiàn)提供技術指導。
《Hadoop生態(tài)體系項目實戰(zhàn)》主要以Hadoop生態(tài)體系為主線,以用戶畫像項目貫穿全書進行講解,包含其各組件的功能和使用方法以及數(shù)據(jù)采集、存儲、分析、可視化等知識。全書知識點的講解由淺入深,使每一位讀者都能有所收獲,也保持了整《Hadoop生態(tài)體系項目實戰(zhàn)》的知識深度。
《Hadoop生態(tài)體系項目實戰(zhàn)》主要涉及八個項目,即Hadoop介紹、分布式文件系統(tǒng)(HDFS)、強大的計算框架(Map Reduce)、數(shù)據(jù)倉庫工具(Hive)、分布式數(shù)據(jù)庫(HBase)、數(shù)據(jù)遷移工具(Sqoop)、日志收集系統(tǒng)(Flume)、構建Persona項目,嚴格按照生產環(huán)境中的操作流程對知識體系進行編排。從數(shù)據(jù)的存儲、清洗、分析、遷移,一直到分析結果的可視化展示,使用循序漸進的方式對知識點進行講解。
《Hadoop生態(tài)體系項目實戰(zhàn)》結構合理、內容詳細、條理清晰,每個項目都通過學習目標、學習路徑、任務描述、任務技能、任務實施、任務總結、英語角和任務習題八個模塊進行相應知識的講解。其中,學習目標和學習路徑模塊對本項目包含的知識點進行簡述,任務實施模塊對本項目中的案例進行步驟化的講解,任務總結模塊作為最后陳述,對使用的技術和注意事項進行總結,英語角模塊解釋本項目中專業(yè)術語的含義,使學生全面掌握所講內容。
《Hadoop生態(tài)體系項目實戰(zhàn)》理論知識簡明扼要,實例操作講解細致,步驟清晰,理論與操作相結合,操作結束后有對應的效果圖,便于讀者直觀、清晰地看到操作效果,牢記書中的操作步驟。
希望《Hadoop生態(tài)體系項目實戰(zhàn)》使讀者對Hadoop生態(tài)體系相關知識的學習過程更加順利。
大數(shù)據(jù)時代的來臨在引領無數(shù)技術變革的同時,也在悄無聲息地改變著各行各業(yè)。隨著大數(shù)據(jù)技術的發(fā)展和傳統(tǒng)技術的革新,醫(yī)療、交通、金融、電商等多個行業(yè)已經在使用大數(shù)據(jù)技術進行海量數(shù)據(jù)的處理,如疾病預防、出行規(guī)劃、股票預測、行為分析等。本書為用戶行為日志分析的實現(xiàn)提供技術指導。
本書主要以Hadoop生態(tài)體系為主線,以用戶畫像項目貫穿全書進行講解,包含其各組件的功能和使用方法以及數(shù)據(jù)采集、存儲、分析、可視化等知識。全書知識點的講解由淺入深,使每一位讀者都能有所收獲,也保持了整本書的知識深度。
本書主要涉及八個項目,即Hadoop介紹、分布式文件系統(tǒng)(HDFS)、強大的計算框架(Map Reduce)、數(shù)據(jù)倉庫工具(Hive)、分布式數(shù)據(jù)庫(HBase)、數(shù)據(jù)遷移工具(Sqoop)、日志收集系統(tǒng)(Flume)、構建Persona項目,嚴格按照生產環(huán)境中的操作流程對知識體系進行編排。從數(shù)據(jù)的存儲、清洗、分析、遷移,一直到分析結果的可視化展示,使用循序漸進的方式對知識點進行講解。
本書結構合理、內容詳細、條理清晰,每個項目都通過學習目標、學習路徑、任務描述、任務技能、任務實施、任務總結、英語角和任務習題八個模塊進行相應知識的講解。其中,學習目標和學習路徑模塊對本項目包含的知識點進行簡述,任務實施模塊對本項目中的案例進行步驟化的講解,任務總結模塊作為最后陳述,對使用的技術和注意事項進行總結,英語角模塊解釋本項目中專業(yè)術語的含義,使學生全面掌握所講內容。
本書由馬曉虎、劉健擔任主編,康華、董善志、李旭東、邰偉民、魏莉芳、李慧擔任副主編。具體分工為:馬曉虎和劉健負責全書的編排,項目一和項目二由康華、董善志負責編寫,項目三和項目四由董善志、邰偉民負責編寫,項目五和項目六由李旭東、邰偉民負責編寫,項目七和項目八由魏莉芳、李慧負責編寫。
本書理論知識簡明扼要,實例操作講解細致,步驟清晰,理論與操作相結合,操作結束后有對應的效果圖,便于讀者直觀、清晰地看到操作效果,牢記書中的操作步驟。希望本書使讀者對Hadoop生態(tài)體系相關知識的學習過程更加順利。
項目一 Hadoop介紹
學習目標
學習路徑
任務描述
任務技能
任務實施
任務總結
英語角
任務習題
項目二 分布式文件系統(tǒng)(HDFS)
學習目標
學習路徑
任務描述
任務技能
任務實施
任務總結
英語角
任務習題
項目三 強大的計算框架(MapReduce)
學習目標
學習路徑
任務描述
任務技能
任務實施
任務總結
英語角
任務習題
項目四 數(shù)據(jù)倉庫工具(Hive)
學習目標
學習路徑
任務描述
任務技能
任務實施
任務總結
英語角
任務習題
項目五 分布式數(shù)據(jù)庫(HBase)
學習目標
學習路徑
任務描述
任務技能
任務實施
任務總結
英語角
任務習題
項目六 數(shù)據(jù)遷移工具(Sqoop)
學習目標
學習路徑
任務描述
任務技能
任務實施
任務總結
英語角
任務習題
項目七 日志收集系統(tǒng)(Flume)
學習目標
學習路徑
任務描述
任務技能
任務實施
任務總結
英語角
任務習題
……
項目八 構建Persona項目