插我一区二区在线观看,亚洲国产精品软件

《Hadoop大數(shù)據(jù)技術(shù)基礎(chǔ)（Python版）微課視頻版》從初學者角度出發(fā)，通過豐富的示例和實戰(zhàn)項目，詳細講解大數(shù)據(jù)開發(fā)環(huán)境、關(guān)鍵技術(shù)及其應(yīng)用。全書共分10章，第1~9章的內(nèi)容分別為大數(shù)據(jù)概述、Linux系統(tǒng)的安裝與使用、Python 3語言基礎(chǔ)、Hadoop開發(fā)環(huán)境、HDFS技術(shù)、MapReduce技術(shù)、Hive數(shù)據(jù)倉庫、HBase分布式數(shù)據(jù)庫、Sqoop工具，第10章詳細解析了實戰(zhàn)項目貨運車分布分析平臺，幫助初學者快速入門。本書所有知識點都結(jié)合具體的編程示例，對于重要知識點提供視頻講解，還設(shè)計了多個實訓，使讀者通過實踐環(huán)節(jié)加強對知識點的理解和掌握。本書適合作為高等院校計算機應(yīng)用、大數(shù)據(jù)技術(shù)及相關(guān)專業(yè)的教材，也適合作為大數(shù)據(jù)技術(shù)相關(guān)培訓的教材和大數(shù)據(jù)技術(shù)初學者的自學資料。

1. 為什么要學習本書
隨著5G、工業(yè)互聯(lián)網(wǎng)、人工智能等前沿科技的發(fā)展，工業(yè)大數(shù)據(jù)將從探索起步階段邁入縱深發(fā)展階段，迎來快速發(fā)展的機遇期，全球工業(yè)大數(shù)據(jù)行業(yè)的競爭也將變得更為激烈。隨著市場數(shù)據(jù)增長的加劇，國家對數(shù)據(jù)服務(wù)的要求也越來越多樣化、專業(yè)化、快速化，大數(shù)據(jù)的存儲和分析無疑對所有數(shù)據(jù)企業(yè)是一個挑戰(zhàn)。
Apache Hadoop是用于大規(guī)模數(shù)據(jù)存儲及處理的分析引擎，具有高可靠性、高效性、高擴展性、高容錯性、低成本等特點，并且在Hadoop生態(tài)體系中，包含了分布式文件存儲系統(tǒng)、分布式計算系統(tǒng)、分布式列存儲數(shù)據(jù)庫、分布式協(xié)作服務(wù)、數(shù)據(jù)倉庫等多方面的解決方案，深受廣大軟件開發(fā)工程師的喜愛。對于想從事大數(shù)據(jù)行業(yè)的開發(fā)人員來說，學好Hadoop尤為重要。
Hadoop技術(shù)功能強大，涉及知識面較廣，沒有基礎(chǔ)的讀者很難深入Hadoop體系架構(gòu)之中，因此本書采用理論和案例相結(jié)合的講解方式，將知識點由淺入深、由易到難地進行解析，讓初學者能夠在逐漸深入的學習過程中掌握Hadoop的生態(tài)體系。
2. 本書內(nèi)容
本書共分10章，各章內(nèi)容簡介如下。
第1章主要介紹大數(shù)據(jù)的產(chǎn)生與發(fā)展，以及大數(shù)據(jù)技術(shù)的生態(tài)工具。通過本章的學習，讀者應(yīng)了解為什么要學習大數(shù)據(jù)、大數(shù)據(jù)生態(tài)系統(tǒng)有哪些成員。
第2章主要介紹Linux系統(tǒng)的安裝、基本命令操作、權(quán)限與目錄管理、文件操作及網(wǎng)絡(luò)配置。通過本章的學習，讀者應(yīng)掌握Linux系統(tǒng)的常用操作。
第3章主要介紹Python 3語言的基礎(chǔ)語法。通過本章的學習，讀者應(yīng)掌握Python 3環(huán)境的安裝與配置，熟悉Python 3的基礎(chǔ)語法。
第4章主要介紹Hadoop生態(tài)圈常用工具和Hadoop大數(shù)據(jù)集群環(huán)境的搭建。通過本章的學習，讀者應(yīng)掌握Hadoop大數(shù)據(jù)集群環(huán)境的搭建及Hadoop大數(shù)據(jù)集群常見問題的處理。
第5章主要介紹HDFS的工作原理及HDFS的操作。通過本章的學習，讀者應(yīng)掌握HDFS的工作原理、HDFS命令與HDFS API的常用操作，并且能夠使用API解決實際問題。
第6章主要介紹MapReduce的工作原理及API的操作。通過本章的學習，讀者應(yīng)掌握MapReduce的工作原理和API的常用操作，并且能夠使用MRJob模型編程解決實際問題。
第7章主要介紹Hive數(shù)據(jù)倉庫的工作原理、Hive環(huán)境的搭建和HiveQL的使用。通過本章的學習，讀者應(yīng)掌握Hive環(huán)境的安裝與配置，熟悉HiveQL的基礎(chǔ)語法，并且能夠使用HiveQL解決實際問題。
第8章主要介紹HBase分布式數(shù)據(jù)庫的數(shù)據(jù)模型以及操作方式。通過本章的學習，讀者應(yīng)掌握部署HBase集群的方法，了解HBase存儲數(shù)據(jù)的架構(gòu)原理，并且能夠使用HBase分布式數(shù)據(jù)庫解決實際問題。
第9章主要介紹Sqoop工具的環(huán)境搭建及Sqoop工具的使用。通過本章的學習，讀者應(yīng)掌握Sqoop工具的安裝和操作，并且能夠使用Sqoop工具實現(xiàn)ETL操作。
第10章主要介紹貨運車分布分析平臺的構(gòu)建、開發(fā)和部署，該平臺是基于HDFS的離線分析項目，使用Python語言對分析結(jié)果進行了可視化展示。通過本章的學習，讀者應(yīng)掌握如何基于Python語言開發(fā)Hadoop程序。
3. 作者與致謝
本書由劉彬斌著，參與本書的編寫、資料整理、書稿校對、課件制作等工作的有周磊、廖云華、胡涵等。感謝清華大學出版社專業(yè)嚴謹?shù)墓ぷ鲬B(tài)度，為本書的順利出版提供了寶貴的意見，并付出了辛勤的勞動。
4. 配套資源
讀者在學習本書時，可以配合與本書配套的講解視頻、教學大綱、PPT課件、習題和實例源碼等資源，快速提升編程水平和解決實際問題的能力。
讀者掃描本書封底文泉云盤涂層下的二維碼，綁定微信后，即可掃描書中的二維碼觀看對應(yīng)視頻來進行學習（配有視頻的章節(jié)已在目錄中標出）。
教學大綱、PPT課件、習題答案和實例源碼等資源可以從清華大學出版社官方微信公眾號書圈（見封底）下載。關(guān)于本書及資源使用中的問題，請聯(lián)系404905510@qq.com。

編者2022年1月

你還可能感興趣

我要評論