亚洲色欲一区二区三区在线观看,亚洲精品人成电影网

Spark是業(yè)界主流的大數(shù)據(jù)計算框架。本書通過一系列大數(shù)據(jù)應用案例和實踐項目貫穿始終，使用Python詳細闡述了 Spark 大數(shù)據(jù)環(huán)境的搭建、Spark RDD 離線數(shù)據(jù)計算、Spark SQL 離線數(shù)據(jù)處理、Spark Streaming實時數(shù)據(jù)計算等一系列常見的大數(shù)據(jù)處理問題，并在此基礎上對Spark的核心概念及技術原理進行了詳細分析，最后以兩個綜合案例分別展示了Spark離線數(shù)據(jù)處理和實時數(shù)據(jù)處理的具體應用與部署。本書踐行“做中學”的設計理念，內(nèi)容編排符合學習與認知規(guī)律，從簡單細小案例入手，輔以大量配圖對學習過程中涉及的枯燥數(shù)據(jù)、抽象概念和復雜原理進行圖示化說明，語言淺顯易懂，技術體系清晰，邏輯銜接合理。在本書最后兩個綜合案例中，分別從需求分析、技術準備、數(shù)據(jù)清洗、需求實現(xiàn)、數(shù)據(jù)可視化等幾個關鍵環(huán)節(jié)展開敘述，便于讀者對Spark大數(shù)據(jù)項目的整體開發(fā)流程有一個比較清晰的認識。

你還可能感興趣

我要評論