本書采用理論知識與任務(wù)案例相結(jié)合的形式,以PyCharm為主要開發(fā)工具,系統(tǒng)地闡述大數(shù)據(jù)分析處理流程中的常用的第三方庫。全書共13個單元,單元1介紹大數(shù)據(jù)分析的概念等內(nèi)容;單元2和單元3介紹使用numpy與pandas實現(xiàn)科學計算與統(tǒng)計分析的相關(guān)知識;單元4-單元7介紹使用pandas實現(xiàn)數(shù)據(jù)預處理的方法;單元8介紹使
《數(shù)據(jù)治理——理論、方法與實踐》關(guān)注以數(shù)據(jù)為關(guān)鍵要素的數(shù)字經(jīng)濟時代背景下的數(shù)據(jù)治理問題,分為8章。第1、2章以數(shù)據(jù)治理基礎(chǔ)概念作為鋪墊,重點對數(shù)據(jù)、數(shù)據(jù)治理以及數(shù)據(jù)治理體系所涵蓋的內(nèi)容進行全面梳理,明晰數(shù)據(jù)治理的現(xiàn)狀、趨勢,并進行國內(nèi)外數(shù)據(jù)治理理念與體系的比較;第3~7章是數(shù)據(jù)治理核心問題探討,重點對數(shù)據(jù)開放、數(shù)據(jù)交易
本書共分三個部分,分別是基礎(chǔ)篇、實踐篇和拓展篇;A(chǔ)篇是對整個課程的歷史、背景和技術(shù)原理的解釋部分,基礎(chǔ)篇包含三個項目,講解了的大數(shù)據(jù)處理流程、大數(shù)據(jù)存儲架構(gòu)、大數(shù)據(jù)存儲技術(shù)路線等知識。實踐篇則是更偏重于理論的實驗部分,實驗內(nèi)容較多,注重簡單、易學和實用等原則,實踐篇包含三個項目,講解了結(jié)構(gòu)化數(shù)據(jù)存儲技術(shù)路線、Post
本書按照“理論+實戰(zhàn)”的形式編寫,將企業(yè)項目需求分解為單獨的任務(wù),全面系統(tǒng)地講解了大數(shù)據(jù)采集與預處理的相關(guān)知識與技術(shù)。全書針對數(shù)據(jù)采集的不同來源,將知識內(nèi)容分為五個項目,包括網(wǎng)絡(luò)數(shù)據(jù)采集、分布式消息系統(tǒng)Kafka、實時數(shù)據(jù)庫采集工具Canal和Maxwell、ETL日志采集技術(shù)棧以及ETL工具——Kettle。本書針對
全書共9章,內(nèi)容涉及數(shù)據(jù)采集、環(huán)境部署、Kettle安裝及應(yīng)用、pandas應(yīng)用以及Python應(yīng)用案例,由淺入深地介紹了數(shù)據(jù)可視化的基礎(chǔ)內(nèi)容。
"本書是一本面向大數(shù)據(jù)基礎(chǔ)知識學習、基本技能訓練和場景應(yīng)用的項目化教程。全書共分為8個單元,內(nèi)容包括初識大數(shù)據(jù)、Linux應(yīng)用基礎(chǔ)、大數(shù)據(jù)存儲與計算、大數(shù)據(jù)編程基礎(chǔ)、數(shù)據(jù)采集與預處理、數(shù)據(jù)分析與挖掘、數(shù)據(jù)可視化、大數(shù)據(jù)典型行業(yè)應(yīng)用分析。本書知識點全面,融合了大數(shù)據(jù)應(yīng)用開發(fā)的新技術(shù)和多個典型行業(yè)應(yīng)用場景,突出情境案例導引
本書以大數(shù)據(jù)分析與挖掘的常用技術(shù)與真實案例相結(jié)合的方式,按照“概念和原理講解、案例分析、能力拓展——Python軟件應(yīng)用”的層次進行闡述,深入淺出地介紹大數(shù)據(jù)分析與挖掘的重要內(nèi)容。全書共11章,第1章作為全書的緒論,介紹了大數(shù)據(jù)分析與挖掘的基本概念、行業(yè)應(yīng)用等;第2章介紹了Python的安裝、編程基礎(chǔ)以及常用的數(shù)據(jù)分析
Spark是業(yè)界主流的大數(shù)據(jù)計算框架。本書通過一系列大數(shù)據(jù)應(yīng)用案例和實踐項目貫穿始終,使用Python詳細闡述了Spark大數(shù)據(jù)環(huán)境的搭建、SparkRDD離線數(shù)據(jù)計算、SparkSQL離線數(shù)據(jù)處理、SparkStreaming實時數(shù)據(jù)計算等一系列常見的大數(shù)據(jù)處理問題,并在此基礎(chǔ)上對Spark的核心概念及技術(shù)原理進行了
本書第4版根據(jù)計算機控制與網(wǎng)絡(luò)技術(shù)的發(fā)展,基于工業(yè)界、科技界和教育界的成果進行了全面修訂。本書面向新工科建設(shè)、工程教育專業(yè)認證和卓越工程人才培養(yǎng)計劃,以立德樹人為根本任務(wù),以科學家精神、企業(yè)家精神、工匠精神等中國精神為動力,以培養(yǎng)學生解決復雜工程和實際問題的綜合能力為出發(fā)點,以主流機型PC/ISA/PCI/PCIE總
本書是備受廣大讀者推崇的數(shù)據(jù)結(jié)構(gòu)與算法入門教程,已在GitHub獲得超60k的Star,并多次登頂GitHubTrending。書中系統(tǒng)介紹了數(shù)據(jù)結(jié)構(gòu)與算法基礎(chǔ)、復雜度分析、數(shù)組與鏈表、棧與隊列、哈希表、樹、堆、圖、搜索、排序、分治、回溯、動態(tài)規(guī)劃和貪心算法等核心知識,通過清晰易懂的解釋和豐富的代碼示例,以及生動形象的