本書按照大數(shù)據(jù)分析流程,以電商產(chǎn)品數(shù)據(jù)為例,由淺入深地講解大數(shù)據(jù)分析的核心開發(fā)技術(shù),以及大數(shù)據(jù)分析工具及其組件的作用和使用方法。本書內(nèi)容系統(tǒng)、全面,可幫助讀者快速掌握大數(shù)據(jù)分析技術(shù)。本書介紹了大數(shù)據(jù)分析的概念、應(yīng)用場景、分析指標(biāo)、分析工具、分析組件、分布式存儲、分布式處理、數(shù)據(jù)離線分析、數(shù)據(jù)實(shí)時(shí)分析、數(shù)據(jù)挖掘,以及數(shù)據(jù)
本書按照大數(shù)據(jù)采集與預(yù)處理的實(shí)現(xiàn)流程,由淺入深地講解大數(shù)據(jù)采集與預(yù)處理的相關(guān)技術(shù),以及如何使用不同方式對大數(shù)據(jù)進(jìn)行采集與預(yù)處理。本書內(nèi)容系統(tǒng)、全面,可幫助開發(fā)人員快速實(shí)現(xiàn)大量數(shù)據(jù)的采集。本書主要內(nèi)容包括大數(shù)據(jù)采集與預(yù)處理簡介、PyCharm的安裝與使用、Urllib庫數(shù)據(jù)采集、Requests庫數(shù)據(jù)采集、XPath和B
《數(shù)據(jù)分析實(shí)踐:專業(yè)知識和職場技巧》從初學(xué)者的角度出發(fā),講解了進(jìn)階為高級數(shù)據(jù)分析師所需的知識和技能,其中既包括數(shù)據(jù)分析崗位的介紹、發(fā)展現(xiàn)狀及未來趨勢,也包括實(shí)際工作中各環(huán)節(jié)的方法策略、實(shí)戰(zhàn)案例,還包括職場中的困惑解答及面試指導(dǎo)。閱讀本書,并基于本書進(jìn)一步拓展所需要的知識能,可以幫助讀者形成一套成系統(tǒng)、可實(shí)戰(zhàn)的數(shù)據(jù)分析方
本書是按照教育部“一體化設(shè)計(jì)、結(jié)構(gòu)化課程、顆;Y源”的邏輯建設(shè)理念,由從事實(shí)踐教學(xué)的教師和企業(yè)一線工程師聯(lián)合編寫而成的。本書基于iFIX智能平臺,采用項(xiàng)目式結(jié)構(gòu)體系,側(cè)重實(shí)踐操作能力及綜合設(shè)計(jì)能力的培養(yǎng)。全書包括15個(gè)基礎(chǔ)項(xiàng)目和5個(gè)綜合項(xiàng)目,系統(tǒng)地介紹了SCADA系統(tǒng)應(yīng)用相關(guān)的知識,通過項(xiàng)目讓學(xué)生代入SCADA工程師
本書集作者多年計(jì)算機(jī)控制技術(shù)的教學(xué)和應(yīng)用實(shí)踐經(jīng)驗(yàn),且通過教材及課件、實(shí)驗(yàn)指導(dǎo)書、教學(xué)輔助APP、思考題與習(xí)題的指導(dǎo)信息等資源,構(gòu)建“立體化教學(xué)平臺”。本書分為理論基礎(chǔ)部分、實(shí)踐部分和應(yīng)用部分。理論基礎(chǔ)部分介紹了計(jì)算機(jī)控制系統(tǒng)。應(yīng)用篇介紹了計(jì)算機(jī)控制技術(shù)在物流自動化領(lǐng)域應(yīng)用的具體模式和實(shí)例。為方便教學(xué)和自學(xué),所有章節(jié)都有
本書對數(shù)據(jù)湖倉的基礎(chǔ)知識、數(shù)據(jù)工程、商業(yè)價(jià)值、數(shù)據(jù)集成等方面進(jìn)行了深入探討,同時(shí)展望了數(shù)據(jù)架構(gòu)的演化趨勢,使讀者能夠領(lǐng)會數(shù)據(jù)湖倉的精髓,最終輕松、全面地管理數(shù)據(jù)湖倉項(xiàng)目。
本書圍繞數(shù)據(jù)分析的基本概念與常用方法,提供一套適用于初學(xué)者快速入門的實(shí)踐教材。本書中以醫(yī)學(xué)數(shù)據(jù)為例,圍繞實(shí)際應(yīng)用場景中最常見的五種數(shù)據(jù)形式:統(tǒng)計(jì)數(shù)據(jù)、文本數(shù)據(jù)、時(shí)序數(shù)據(jù)、圖像數(shù)據(jù)以及健康數(shù)據(jù),從基本概念、初步探索到綜合應(yīng)用的全流程系統(tǒng)示范教學(xué)。本書共計(jì)五個(gè)章節(jié),分別為:統(tǒng)計(jì)數(shù)據(jù)分析、文本數(shù)據(jù)分析、時(shí)序數(shù)據(jù)分析、圖像數(shù)據(jù)
本書系統(tǒng)介紹了大數(shù)據(jù)的相關(guān)知識,全書共13章,內(nèi)容包括Hadoop大數(shù)據(jù)處理架構(gòu)、HDFS分布式文件系統(tǒng)、YARN資源管理、MapReduce分布式計(jì)算框架、HBase分布式數(shù)據(jù)庫、流數(shù)據(jù)采集、典型非關(guān)系數(shù)據(jù)庫的安裝與使用、分布式數(shù)據(jù)分析工具Pig、Spark大數(shù)據(jù)處理框架、基于Python的SparkRDD編程、基于
本書對第1版做了修訂,緊跟傳統(tǒng)分布式計(jì)算、云計(jì)算與大數(shù)據(jù)相關(guān)領(lǐng)域的新技術(shù),以應(yīng)用需求為背景講解相關(guān)技術(shù)原理和應(yīng)用方法,主要內(nèi)容包括:傳統(tǒng)分布式計(jì)算的基本原理和編程開發(fā)技術(shù),云計(jì)算的原理和關(guān)鍵技術(shù)、主流云計(jì)算平臺和編程開發(fā)方法,云原生技術(shù)、云計(jì)算安全技術(shù)與標(biāo)準(zhǔn)及云存儲技術(shù),大數(shù)據(jù)的分析處理關(guān)鍵技術(shù)、計(jì)算模式和編程技術(shù)、平
本書講述:大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進(jìn)行專業(yè)化處理。換而言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實(shí)現(xiàn)盈利的關(guān)鍵,在于提高對數(shù)據(jù)的“加工能力”,通過“加工”實(shí)現(xiàn)數(shù)據(jù)的“增值”。首先,本書在總結(jié)大數(shù)據(jù)的概念、特征的基礎(chǔ)上,給出大數(shù)據(jù)的本質(zhì)是客觀存在的論斷。其次,探討大數(shù)據(jù)價(jià)