《實(shí)時(shí)數(shù)據(jù)處理和分析指南》主要介紹實(shí)時(shí)大數(shù)據(jù)計(jì)算領(lǐng)域的相關(guān)技巧和經(jīng)驗(yàn),包括Flink、Spark和Storm等流處理框架技術(shù)。全書(shū)從搭建開(kāi)發(fā)環(huán)境開(kāi)始,逐步實(shí)現(xiàn)流處理,循序漸進(jìn)地引導(dǎo)讀者學(xué)習(xí)如何利用RabbitMQ、Kafka和NiFi以及Storm、Spark、Flink和Beam等組件協(xié)同應(yīng)用來(lái)解決實(shí)際問(wèn)題。 本書(shū)內(nèi)
本書(shū)主要介紹一套系統(tǒng)的過(guò)程控制方法,以解決過(guò)程控制規(guī)劃、計(jì)劃、執(zhí)行、評(píng)價(jià)、改進(jìn)中的一些基本問(wèn)題。第1~3章主要闡述全套方法的基本內(nèi)容以及方法的采用理由和依據(jù),具體內(nèi)容包括:討論過(guò)程的定義與表示、過(guò)程的基本特征和過(guò)程中斷、延續(xù)、變更、結(jié)束等概念;討論過(guò)程的三種集合、過(guò)程控制框架、過(guò)程控制點(diǎn)控制與評(píng)價(jià)、過(guò)程結(jié)果評(píng)價(jià);介紹幾
本書(shū)分五部分,第一部分?jǐn)?shù)據(jù)科學(xué)引導(dǎo),闡述數(shù)據(jù)科學(xué)的基本概念、原則和方法等內(nèi)容;第二部分?jǐn)?shù)據(jù)分析的數(shù)學(xué)基礎(chǔ),闡述相關(guān)的數(shù)學(xué)知識(shí);第三部分?jǐn)?shù)據(jù)采集與管理,闡述數(shù)據(jù)采集、清洗、管理等知識(shí);第四部分?jǐn)?shù)據(jù)分析基本方法與軟件實(shí)現(xiàn),闡述描述性統(tǒng)計(jì)分析方法等內(nèi)容;第五部分?jǐn)?shù)據(jù)分析案例與實(shí)訓(xùn)。
本書(shū)共五章,內(nèi)容包括:大數(shù)據(jù)技術(shù)研究、高校大數(shù)據(jù)技術(shù)的信息化研究、高校大數(shù)據(jù)技術(shù)的信息化創(chuàng)新研究、高校大數(shù)據(jù)技術(shù)與應(yīng)用專業(yè)人才培養(yǎng)等。
《自動(dòng)線安裝與調(diào)試》遵循“以服務(wù)為宗旨、以就業(yè)為導(dǎo)向、以能力為本位”的高職教育理念,根據(jù)職業(yè)能力培養(yǎng)要求,采用工作過(guò)程為導(dǎo)向的模塊化課程開(kāi)發(fā)模式,打破學(xué)科知識(shí)的界線,針對(duì)實(shí)際工作任務(wù)需要,重新組織和設(shè)計(jì)教學(xué)方式,突出“做中學(xué)”“學(xué)中做”,使學(xué)生在完成任務(wù)的同時(shí),掌握相關(guān)知識(shí)和技能,凸顯職業(yè)教育特色。該書(shū)由學(xué)校、企業(yè)專家
數(shù)據(jù)清洗是大數(shù)據(jù)預(yù)處理的關(guān)鍵環(huán)節(jié)。面對(duì)錯(cuò)綜復(fù)雜的數(shù)據(jù),傳統(tǒng)的清洗“臟”數(shù)據(jù)工作單調(diào)且異常辛苦,如果能利用正確的工具和方法,可以讓數(shù)據(jù)清洗工作變得事半功倍!稊(shù)據(jù)清洗》講解數(shù)據(jù)清洗的理論知識(shí)和實(shí)際應(yīng)用,《數(shù)據(jù)清洗》共8章:第1章主要帶領(lǐng)大家簡(jiǎn)單認(rèn)識(shí)數(shù)據(jù)清洗;第2章主要講解ETL技術(shù)相關(guān)的知識(shí);第3章講解Kettle工具的
本書(shū)以實(shí)戰(zhàn)開(kāi)發(fā)為原則,以Hadoop3.X生態(tài)系統(tǒng)內(nèi)的主要大數(shù)據(jù)工具整合應(yīng)用及項(xiàng)目開(kāi)發(fā)為主線,通過(guò)Hadoop大數(shù)據(jù)開(kāi)發(fā)中常見(jiàn)的11個(gè)典型模塊和3個(gè)完整項(xiàng)目案例,詳細(xì)介紹HDFS、MapReduce、HBase、Hive、Sqoop、Spark等主流大數(shù)據(jù)工具的整合使用。本書(shū)附帶資源包括本書(shū)核心內(nèi)容的教學(xué)視頻,本書(shū)所涉
主要內(nèi)容·大數(shù)據(jù)技術(shù)和Spark概述。·通過(guò)實(shí)例學(xué)習(xí)DataFrame、SQL、Dataset等Spark的核心API。·了解Spark的低級(jí)API實(shí)現(xiàn),包括RDD以及SQL和DataFrame的執(zhí)行過(guò)程。·了解Spark如何在集群上運(yùn)行。·Spar
本書(shū)以Python作為開(kāi)發(fā)Spark應(yīng)用程序的編程語(yǔ)言,系統(tǒng)介紹了Spark編程的基礎(chǔ)知識(shí)。全書(shū)共8章,內(nèi)容包括大數(shù)據(jù)技術(shù)概述、Spark的設(shè)計(jì)與運(yùn)行原理、Spark環(huán)境搭建和使用方法、RDD編程、SparkSQL、SparkStreaming、StructuredStreaming、SparkMLlib等。
現(xiàn)在已經(jīng)有越來(lái)越多的行業(yè)和技術(shù)領(lǐng)域需要大數(shù)據(jù)分析系統(tǒng),例如金融行業(yè)需要使用大數(shù)據(jù)系統(tǒng)進(jìn)行信貸風(fēng)控,零售、餐飲行業(yè)需要通過(guò)大數(shù)據(jù)系統(tǒng)進(jìn)行輔助銷(xiāo)售決策,各種物聯(lián)網(wǎng)場(chǎng)景需要大數(shù)據(jù)系統(tǒng)持續(xù)聚合和分析時(shí)序數(shù)據(jù),各大科技公司需要建立大數(shù)據(jù)分析中臺(tái)等等!洞髷(shù)據(jù)綜合應(yīng)用項(xiàng)目實(shí)戰(zhàn)/高等職業(yè)院;诠ぷ鬟^(guò)程項(xiàng)目式系列教材》為培養(yǎng)和開(kāi)發(fā)大