本書詳細闡述了培養(yǎng)具有數(shù)據(jù)素養(yǎng)的技術(shù)技能型人才所需要的大數(shù)據(jù)相關(guān)基礎(chǔ)知識。本書在確定知識布局時,秉持的一個基本原則是,緊緊圍繞大數(shù)據(jù)通識教育核心理念,培養(yǎng)學(xué)生的數(shù)據(jù)意識、數(shù)據(jù)思維、數(shù)據(jù)安全和數(shù)據(jù)分析能力。全書共7章,內(nèi)容包括大數(shù)據(jù)概述,大數(shù)據(jù)思維,數(shù)據(jù)庫基礎(chǔ)知識,大數(shù)據(jù)分析技術(shù)及相關(guān)應(yīng)用,數(shù)據(jù)可視化概論,大數(shù)據(jù)安全,大
本書系統(tǒng)、全面地介紹大數(shù)據(jù)技術(shù)的基礎(chǔ)知識。全書共13章,首先介紹大數(shù)據(jù)行業(yè)與技術(shù)趨勢;然后介紹大數(shù)據(jù)生態(tài)圈的各項技術(shù),包括分布式文件系統(tǒng)、Hive分布式數(shù)據(jù)倉庫、HBase技術(shù)原理、MapReduce和YARN技術(shù)原理、Spark基于內(nèi)存的分布式計算、Flink流批一體分布式實時處理引擎、數(shù)據(jù)采集與數(shù)據(jù)裝載工具、Kaf
《大數(shù)據(jù)百科術(shù)語辭典》漢外對照系列叢書是全球首套系統(tǒng)研究大數(shù)據(jù)術(shù)語的多語種智能化專業(yè)辭典。本叢書對大數(shù)據(jù)知識體系進行了全面梳理,提出了九個方面的術(shù)語架構(gòu),形成了統(tǒng)一規(guī)范、符合國際通用規(guī)則的多語種學(xué)術(shù)話語體系;叢書系統(tǒng)性提供漢語與其他二十個語種的術(shù)語規(guī)范表述,以中外文對照的形式展示;叢書開創(chuàng)性融入知識圖譜、有聲點讀、平臺
Hadoop是當前熱門的大數(shù)據(jù)處理與分析平臺。《Hadoop大數(shù)據(jù)開發(fā)基礎(chǔ)項目化教程》將大數(shù)據(jù)平臺相關(guān)內(nèi)容劃分為8個項目,分別是大數(shù)據(jù)時代、Hadoop基礎(chǔ)環(huán)境、Hadoop環(huán)境搭建、分布式存儲HDFS、MapReduce分布式編程、Hadoop數(shù)據(jù)倉庫Hive、Hadoop數(shù)據(jù)庫HBas、協(xié)調(diào)系統(tǒng)Zookeeper,
本書介紹數(shù)據(jù)分析的統(tǒng)計基礎(chǔ)、種類劃分,并列舉大量實例以說明數(shù)據(jù)分析方法和算法。內(nèi)容主要分為4部分,第1部分為第1章,介紹一些概念,簡單描述數(shù)據(jù)分析方法和一些實例;第2部分包括第2~7章,介紹描述性分析和數(shù)據(jù)預(yù)處理的主要方法,包括描述統(tǒng)計、多元描述分析、聚類以及頻繁模式挖掘等;第3部分包括第8~12章,介紹預(yù)測性分析的主
面對日漸復(fù)雜的大數(shù)據(jù),科技工作者很難用單一的統(tǒng)計軟件高效、完美地完成從數(shù)據(jù)挖掘、數(shù)據(jù)清洗、統(tǒng)計分析到結(jié)果呈現(xiàn)的全部工作,因此需要熟悉和掌握多種統(tǒng)計工具,各取所長、整合使用。本書立足于大數(shù)據(jù)研究的現(xiàn)狀,基于實際醫(yī)療案例,介紹數(shù)學(xué)基礎(chǔ)知識和統(tǒng)計學(xué)基礎(chǔ)知識,SAS、R語言、Stata和Python這4款大數(shù)據(jù)常用分析工具的基
大數(shù)據(jù)技術(shù)凝集了多學(xué)科的研究成果,是一門多學(xué)科的交叉融合技術(shù)。隨著科學(xué)技術(shù)的發(fā)展,大數(shù)據(jù)技術(shù)發(fā)展更為迅速,應(yīng)用更為深入與廣泛,并凸顯其巨大潛力和應(yīng)用價值。“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)導(dǎo)論”是數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)的第一門專業(yè)基礎(chǔ)課程。這門課程可以引導(dǎo)數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)的學(xué)生走進大數(shù)據(jù)技術(shù)的大門。本書主要介紹數(shù)據(jù)科學(xué)與
本書全面地介紹了大數(shù)據(jù)可視化的基礎(chǔ)知識和基本技術(shù)。全書共分為8章,內(nèi)容包括大數(shù)據(jù)可視化的基本概念,可視化原則,視覺設(shè)計基礎(chǔ)知識,數(shù)據(jù)處理技術(shù),對比趨勢、比例數(shù)據(jù)、關(guān)系數(shù)據(jù)等多種數(shù)據(jù)可視化方式,以及利用可視化對數(shù)據(jù)進行探索與預(yù)測,并通過綜合分析案例梳理完整大數(shù)據(jù)可視化流程。1.數(shù)據(jù)可視化設(shè)計理論以必需、夠用為度,注重實用
第3版介紹并擴展了許多主題,提供了軟件工具和數(shù)據(jù)挖掘應(yīng)用程序的修訂部分;還更新了參考書目列表,供感興趣的讀者進一步研究;擴展了涉及每個章節(jié)的問題列表。 展示了如下新信息: 探索大數(shù)據(jù)和云計算論述深度學(xué)習(xí) 包括卷積神經(jīng)網(wǎng)絡(luò)(CNN)的信息提出了強化學(xué)習(xí) 包含半監(jiān)督學(xué)習(xí)