免费的日本黄页网在线,亚洲国产无套无码AV电影,亚洲欧美成人在线

　　本書的知識架構是在培訓了多屆學員的基礎上總結整理得來的，已經(jīng)經(jīng)過了實踐的考驗，證實了其科學性；本書當中的案例都為企業(yè)實際開發(fā)的案例，通過學習這些大量的實際案例，幫助學生在進入企業(yè)后可以很快融入大數(shù)據(jù)工作崗位。本書包括大數(shù)據(jù)概論、初識Hadoop、認識HDFS、HDFS的運行機制、訪問HDFS、HadoopI/O詳解、認識MapReduce編程模型、MapReduce應用編程開發(fā)、MapReduce的工作機制與YARN平臺、MapReduce高級開發(fā)、MapReduce實例共11章內(nèi)容。本書既可作為高等院校學習大數(shù)據(jù)技術的教材，亦可作為廣大大數(shù)據(jù)技術學習者的入門用書。

　　為什么要寫這本書
　　近年來，大數(shù)據(jù)（big data）一詞越來越多地被提及，人們用它來描述和定義信息爆炸時代產(chǎn)生的海量數(shù)據(jù)，并命名與之相關的技術發(fā)展與創(chuàng)新。它已經(jīng)上過《紐約時報》、《華爾街日報》的專欄封面，進入美國白宮官網(wǎng)的新聞，現(xiàn)身在國內(nèi)一些互聯(lián)網(wǎng)主題的講座沙龍中，甚至被嗅覺靈敏的國金證券、國泰君安、銀河證券等寫進了投資推薦報告。最早提出“大數(shù)據(jù)”時代到來的是全球知名咨詢公司麥肯錫。麥肯錫稱: “數(shù)據(jù)，已經(jīng)滲透到當今每一個行業(yè)和業(yè)務職能領域，成為重要的生產(chǎn)因素。人們對于海量數(shù)據(jù)的挖掘和運用，預示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來�！薄按髷�(shù)據(jù)”在物理學、生物學、環(huán)境生態(tài)學等領域以及軍事、金融、通信等行業(yè)存在已有時日，卻因為近年來互聯(lián)網(wǎng)和信息行業(yè)的發(fā)展而引起人們關注。數(shù)據(jù)正在迅速膨脹并變大，它決定著企業(yè)的未來發(fā)展，雖然很多企業(yè)可能還沒有意識到數(shù)據(jù)爆炸性增長帶來問題的隱患，但是隨著時間的推移，人們將越來越多地意識到數(shù)據(jù)對企業(yè)的重要性。
　　在如今的社會，大數(shù)據(jù)的應用越來越彰顯它的優(yōu)勢，它占領的領域也越來越大，如電子商務、O2O、物流配送等，各種利用大數(shù)據(jù)進行發(fā)展的領域正在協(xié)助企業(yè)不斷地發(fā)展新業(yè)務和創(chuàng)新運營模式。有了大數(shù)據(jù)這個概念，對于消費者行為的判斷，產(chǎn)品銷售量的預測，精確的營銷范圍以及存貨的補給已經(jīng)得到全面的改善與優(yōu)化。然而，這些數(shù)據(jù)的規(guī)模是如此龐大，以至于不能用G或T來衡量。
　　為了解決這些數(shù)據(jù)的存儲和相關計算問題，就必須構建一個強大且穩(wěn)定的分布式集群系統(tǒng)作為搜索引擎的基礎架構支撐平臺，但是對于大多數(shù)互聯(lián)網(wǎng)公司而言，研發(fā)這樣一個高效性能系統(tǒng)往往要支付高昂的費用。經(jīng)過多年的發(fā)展，如今已形成了以Hadoop為核心的大數(shù)據(jù)生態(tài)系統(tǒng)，開創(chuàng)了通用海量數(shù)據(jù)處理基礎架構平臺的先河。Hadoop是一個優(yōu)秀的分布式計算系統(tǒng)，利用通用的硬件就可以構建一個強大、穩(wěn)定、簡單并且高效的分布式集群計算系統(tǒng)，完全可以滿足互聯(lián)網(wǎng)公司基礎架構平臺的需求，付出相對低廉的代價就可以輕松處理超大規(guī)模的數(shù)據(jù)。因此，使用Hadoop的公司越來越多，具有豐富工作經(jīng)驗的Hadoop人才也就越來越供不應求，從而學習和使用Hadoop的愛好者和開發(fā)者也越來越多，編寫這本書也正是為了幫助更多的人學習并掌握Hadoop技術，從而推動Hadoop技術在中國的推廣，進而推動中國信息產(chǎn)業(yè)的發(fā)展。
　　讀者對象
　　本書適合以下讀者閱讀:
　�。�1）大數(shù)據(jù)技術的學習者和愛好者；
　　（2）有Java基礎的開發(fā)者；
　�。�3） Hadoop技術開發(fā)者；大數(shù)據(jù)
　　技術基礎
　　前言
　�。�4） Hadoop集群運維開發(fā)者；
　�。�5）分布式系統(tǒng)的相關研發(fā)人員。
　　如何閱讀本書
　　本書分為三個部分。
　　第一部分為簡介。簡介部分為第1章，主要介紹了大數(shù)據(jù)的時代背景，從大數(shù)據(jù)來源到大數(shù)據(jù)的價值和影響，以及對應用場景和發(fā)展前景的介紹，幫助用戶明白什么是大數(shù)據(jù)，大數(shù)據(jù)是用來干什么的，以及大數(shù)據(jù)的發(fā)展前景是怎樣的。大數(shù)據(jù)的基本概念，首先明白什么是大數(shù)據(jù)，大數(shù)據(jù)中數(shù)據(jù)結構的復雜度，重點明白大數(shù)據(jù)的四個核心特征，接著了解大數(shù)據(jù)所使用的技術，最后介紹了一些大數(shù)據(jù)的應用實例，幫助大家更好地理解大數(shù)據(jù)、大數(shù)據(jù)系統(tǒng)，理解其核心設計目標，在系統(tǒng)設計目標的實現(xiàn)過程中，系統(tǒng)還需遵循一定的設計原則。
　　第二部分為Hadoop技術的講解，包括第2章到第9章。從認識Hadoop開始到正式介紹Hadoop的基本應用，通過HDFS分布式文件系統(tǒng)和MapReduce并行計算模型從理論到實現(xiàn)機制的角度對Hadoop計算進行講解。講述了HDFS的特性和目標、核心設計、體系結構以及HDFS中數(shù)據(jù)流的讀寫、HA機制和Federation機制，同時重點介紹了HDFS的命令行接口和Java接口。接著介紹了Hadoop I/O，講述了數(shù)據(jù)的完整性、文件壓縮、問價序列化和Hadoop文件的數(shù)據(jù)結構。最后是對MapReduce的講解，由淺入深，講述了MapReduce的編程模型，MapReduce應用編程開發(fā)，包括MapReduce的類型格式，Java API解析，還重點講述了MapReduce的工作機制與YARN平臺，包括MapReduce作業(yè)運行機制的剖析、shuffle和排序、任務的執(zhí)行、作業(yè)調度、YARN平臺的簡介和架構。
　　第三部分為實戰(zhàn)部分，包括第10章和第11章。首先是從幾個具體的小實例講解了簡單高效的MapReduce編程方式。然后通過最后的MapReduce編程實例，帶我們進入大數(shù)據(jù)實戰(zhàn)項目，幫助學習者更深入地掌握Hadoop技術。
　　勘誤和支持
　　除本書編委會以外，參加本書編寫的工作人員有: 毛妍、白高平、趙真。由于本書編寫者水平有限，書中難免會出現(xiàn)一些錯誤或者不準確的地方，懇請讀者批評指正，可以將書中遇到的錯誤和問題發(fā)郵件，希望您能提出更多寶貴的意見，期待您的真摯反饋。

你還可能感興趣

我要評論