該書通過對數(shù)據(jù)庫和信息系統(tǒng)中的數(shù)據(jù)與信息質(zhì)量的現(xiàn)狀和未來發(fā)展進行充分、完整而全面的綜述,對組成數(shù)據(jù)與信息質(zhì)量研究核心的技術(shù)進行了深入探討,包括對象識別、數(shù)據(jù)集成、錯誤定位與糾正等,并在一個原創(chuàng)框架下對相關(guān)技術(shù)進行比較研究。該書除了將數(shù)據(jù)與信息質(zhì)量作為獨立研究領(lǐng)域進行系統(tǒng)描述,還包括了從其他領(lǐng)域借鑒的研究成果,如概率論、
本書采用項目驅(qū)動方式,從理論到實踐,由淺入深地設(shè)計了17個項目,包括認識大數(shù)據(jù)分析、Python數(shù)據(jù)分析工具、numpy數(shù)據(jù)分析和處理、Pandas數(shù)據(jù)分析和處理、Matplotlib數(shù)據(jù)分析可視化、基于HADOOP的數(shù)據(jù)分析和機器學(xué)習(xí)。
本書系統(tǒng)闡述了Pandas基礎(chǔ)知識、應(yīng)用原理,以及應(yīng)用流程和應(yīng)用技巧等實戰(zhàn)知識。全書共分為5篇:第一篇為入門篇(第1和2章),第二篇為基礎(chǔ)篇(第3和4章),第三篇為基礎(chǔ)強化篇(第5-7章),第四篇為進階篇(第8-11章),第五篇為案例篇(第12章)。書中主要內(nèi)容包括Python簡介、NumPy基礎(chǔ)、Pandas入門、數(shù)
這是一本從實戰(zhàn)角度解讀如何進行智能數(shù)據(jù)分析及搭建智能數(shù)據(jù)分析平臺的工具書,目的是幫助讀者全面認識并在實際工作中靈活使用智能數(shù)據(jù)分析,同時構(gòu)建可用的智能數(shù)據(jù)分析環(huán)境。本書不僅包含關(guān)于智能數(shù)據(jù)分析的基礎(chǔ)知識,還包含進行智能數(shù)據(jù)分析必備的方法、工具、案例,以及平臺的搭建方案。全書共分為8章。第1-2章在全面剖析了智能數(shù)據(jù)分析
《Offer來敲門大數(shù)據(jù)開發(fā)面試筆試精講在線真題實訓(xùn)視頻版》圍繞大數(shù)據(jù)開發(fā)的相關(guān)技術(shù),以大數(shù)據(jù)開發(fā)的基本要求為綱,以企業(yè)在筆試和面試中的試題為核心,從企業(yè)考核的角度組織內(nèi)容,并對這些試題加上了詳細的分析說明,以考促學(xué)!禣ffer來敲門大數(shù)據(jù)開發(fā)面試筆試精講在線真題實訓(xùn)視頻版》既包括Java、Python等基礎(chǔ)編程知識
本教材基于數(shù)據(jù)技術(shù)概念的提出,建立由數(shù)據(jù)生成、數(shù)據(jù)組織管理與數(shù)據(jù)信息汲取三個模塊構(gòu)成的數(shù)據(jù)技術(shù)應(yīng)用全流程體系框架。通過對計算機信息系統(tǒng)、抽樣技術(shù)與數(shù)據(jù)庫系統(tǒng)等基礎(chǔ)技術(shù)原理的概念化解讀,以及對網(wǎng)絡(luò)爬蟲與文本數(shù)據(jù)生成、SQL語言、數(shù)據(jù)預(yù)處理、回歸模型、Logistic建模、關(guān)聯(lián)規(guī)則、決策樹分類規(guī)則、K-平均聚類、神經(jīng)網(wǎng)絡(luò)、
本書主要內(nèi)容包括大數(shù)據(jù)概論、初識Hadoop、Linux基礎(chǔ)、Hadoop集群搭建、HDFS分布式文件系統(tǒng)、MapReduce分布式計算框架、以及項目實戰(zhàn)--美國新冠疫情covid-19分析。 本書將理論與實踐結(jié)合,補充相關(guān)Linux基礎(chǔ),注重大數(shù)據(jù)技術(shù)的系統(tǒng)性、實用性和先進性,配有大量的應(yīng)用案例,不僅能夠幫助提高大
本書系統(tǒng)介紹了大數(shù)據(jù)技術(shù)與管理決策的基礎(chǔ)知識。內(nèi)容包括大數(shù)據(jù)決策的流程及方法、大數(shù)據(jù)處理的基礎(chǔ)架構(gòu)、大數(shù)據(jù)存儲與管理、大數(shù)據(jù)的采集與預(yù)處理、大數(shù)據(jù)處理的計算架構(gòu)、大數(shù)據(jù)分析與建模、大數(shù)據(jù)可視化、大數(shù)據(jù)治理、大數(shù)據(jù)在管理決策中的綜合應(yīng)用、大數(shù)據(jù)應(yīng)用倫理與法律問題、大數(shù)據(jù)管理決策的挑戰(zhàn)與趨勢等,能夠幫助讀者學(xué)習(xí)、了解大數(shù)據(jù)
本書以大數(shù)據(jù)分析的相關(guān)理論和方法為主線,首先介紹了大數(shù)據(jù)分析所需的預(yù)備知識和常用的降維方法,然后介紹了數(shù)據(jù)挖掘、時間序列分析、人工神經(jīng)網(wǎng)絡(luò)等大數(shù)據(jù)分析方法,最后介紹了大數(shù)據(jù)分析和大數(shù)據(jù)可視化的常用工具,并講解了其相應(yīng)的操作。 本書既可以作為高等院校和高職院校數(shù)據(jù)科學(xué)與大數(shù)據(jù)、大數(shù)據(jù)管理與應(yīng)用、軟件工程及相關(guān)專業(yè)的教材,
本書立足于現(xiàn)代智能數(shù)據(jù)系統(tǒng)與通信網(wǎng)絡(luò)在各種領(lǐng)域快速發(fā)展所引發(fā)的安全問題,從集合數(shù)據(jù)系統(tǒng)可信性研究、物聯(lián)網(wǎng)空間安全、智能安全接入、大數(shù)據(jù)與智能傳感器安全、區(qū)域網(wǎng)絡(luò)攻擊檢測以及云上安全監(jiān)測等方面入手,以支持物聯(lián)網(wǎng)的智能數(shù)據(jù)系統(tǒng)與通信網(wǎng)絡(luò)的角度介紹目前最新的安全技術(shù)與容錯技術(shù),主要包括能夠有效阻止與避免信息泄漏或惡意攻擊的技