關(guān)于我們
![]() ![]() |
Hive數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用教程
本書將Hive相關(guān)技術(shù)分為9個(gè)項(xiàng)目,對(duì)Hive數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用進(jìn)行了詳細(xì)的描述。項(xiàng)目一認(rèn)識(shí)Hive,主要介紹數(shù)據(jù)倉(cāng)庫(kù)的概念、特點(diǎn)、模型、體系結(jié)構(gòu),以及Hive的概念、體系結(jié)構(gòu)、數(shù)據(jù)類型等內(nèi)容。項(xiàng)目二Hive環(huán)境搭建,主要介紹搭建Hive的過程,包括虛擬機(jī)軟件工具的使用方法;Linux鏡像文件的安裝、克隆、啟動(dòng);Linux中的網(wǎng)絡(luò)環(huán)境設(shè)置;Hadoop環(huán)境的搭建;Hive的搭建等內(nèi)容。項(xiàng)目三Hive基本語(yǔ)法,主要介紹了Hive的常用數(shù)據(jù)類型、運(yùn)算符與表達(dá)式、Hive的數(shù)據(jù)存儲(chǔ)方式、常用的交互命令和其他操作命令。項(xiàng)目四Hive數(shù)據(jù)定義,主要介紹數(shù)據(jù)庫(kù)、數(shù)據(jù)表、分區(qū)表、分桶表、視圖、索引的創(chuàng)建、查看、修改和刪除等操作。項(xiàng)目五數(shù)據(jù)的導(dǎo)入與導(dǎo)出,主要介紹通過直接加載、Load加載、查詢加載、Import加載等方式導(dǎo)入數(shù)據(jù),以及通過Insert命令、Hadoop命令、HiveShell命令等方式導(dǎo)出數(shù)據(jù)的方法。項(xiàng)目六Hive數(shù)據(jù)查詢,主要介紹Hive數(shù)據(jù)庫(kù)的基本查詢、條件查詢、分組、連接、排序等語(yǔ)句,以及隨機(jī)抽樣查詢等操作。項(xiàng)目七Hive函數(shù),主要介紹了內(nèi)置函數(shù)的應(yīng)用,包括算術(shù)函數(shù)、聚合函數(shù)、日期時(shí)間函數(shù)、條件函數(shù)以及字符串函數(shù),Hive其他常見函數(shù)以及自定義函數(shù)的應(yīng)用。項(xiàng)目八Hive優(yōu)化,主要介紹了本地模式、配MapReduce壓縮、配置Map和Reduce個(gè)數(shù)、合并小文件、聚合語(yǔ)句、連接語(yǔ)句、統(tǒng)計(jì)語(yǔ)句、行/列過濾等優(yōu)化方式。項(xiàng)目九綜合案例,通過對(duì)電商銷售大數(shù)據(jù)的分析,綜合應(yīng)用前述所學(xué)知識(shí)完成Hive數(shù)據(jù)倉(cāng)庫(kù)的建庫(kù)建表,已經(jīng)完成各類電商數(shù)據(jù)的統(tǒng)計(jì)分析。
你還可能感興趣
我要評(píng)論
|