當(dāng)今是一個大數(shù)據(jù)的時代,人們已經(jīng)生活在數(shù)據(jù)的海洋之中。本書嘗試了解學(xué)習(xí)者的想法和需要,強(qiáng)調(diào)統(tǒng)計學(xué)的基本概念,突出數(shù)據(jù),使用R軟件為讀者呈現(xiàn)可見即可得的統(tǒng)計分析過程,讓讀者能夠輕松、愉快地了解統(tǒng)計的基本思想和應(yīng)用價值。本書可讀性強(qiáng),語言輕松活潑,內(nèi)容通俗易懂。 本書可作為高等學(xué)校理、工、農(nóng)、醫(yī)、經(jīng)濟(jì)、管理、人文社會科學(xué)專業(yè)的統(tǒng)計學(xué)教材,也可以供從事商務(wù)活動和經(jīng)濟(jì)分析等實際工作的各類人員參考。
當(dāng)今是一個大數(shù)據(jù)的時代,大數(shù)據(jù)的概念已經(jīng)深入人心。毫不夸張地說,人們已經(jīng)生活在數(shù)據(jù)的海洋之中。各行各業(yè)、不同人群都聽說過大數(shù)據(jù),了解統(tǒng)計方法。而數(shù)據(jù)到信息、再到知識,需要用統(tǒng)計方法揭示出來。數(shù)據(jù)不僅限于數(shù)字,也可能是圖表或者文字、音樂、視頻等。統(tǒng)計學(xué)是數(shù)據(jù)的科學(xué)和藝術(shù),其所分析的對象就是數(shù)據(jù)。統(tǒng)計學(xué)與各個學(xué)科的數(shù)據(jù)都有聯(lián)系,幾乎應(yīng)用于所有領(lǐng)域。這就決定了大多數(shù)統(tǒng)計應(yīng)用不是由統(tǒng)計學(xué)家實施的,而是由實際工作者(包括目前正在學(xué)習(xí)統(tǒng)計學(xué)的本科生、研究生)完成的。作為一個數(shù)據(jù)接收者或者使用者,在日常生活和工作中,了解統(tǒng)計學(xué)的基本概念以及懂得如何用統(tǒng)計手段去解決問題是非常重要的。
根據(jù)作者多年的教學(xué)經(jīng)驗,一本好的教材要以人為本,不僅重視傳授統(tǒng)計學(xué)科的特點,也要了解讀者學(xué)習(xí)統(tǒng)計的需求。因此,本書非常重視統(tǒng)計學(xué)的基本概念、公式和方法,這有助于讀者了解統(tǒng)計方法和思想的精髓。很多煩瑣的計算則交給統(tǒng)計軟件去完成,讓讀者結(jié)合數(shù)據(jù)理解相關(guān)統(tǒng)計方法,突出各種統(tǒng)計方法的介紹和使用。
本書的最大特色就是在干中學(xué),極大地方便了讀者的理解和學(xué)習(xí)。使用非常方便的R軟件使得統(tǒng)計技術(shù)不再枯燥,不僅為讀者呈現(xiàn)了可見即可得的數(shù)據(jù)分析過程,而且這種便捷性有助于讀者馬上動手實踐,能更好地體會不同類型和結(jié)構(gòu)的數(shù)據(jù)需要何種合適的統(tǒng)計方法,從而得到最大的啟發(fā),進(jìn)而有興趣掌握統(tǒng)計的基本概念和方法,在潛移默化中輕松、愉快地了解統(tǒng)計的基本思想。數(shù)據(jù)和方法的大量使用也使得本書內(nèi)容通俗易懂,語言輕松活潑,可讀性強(qiáng)。
本書可作為理、工、農(nóng)、醫(yī)、經(jīng)濟(jì)、管理、人文社會科學(xué)專業(yè)的統(tǒng)計學(xué)教材,也可以供從事商務(wù)活動和經(jīng)濟(jì)分析等實際工作的各類人員參考。本書相關(guān)的資料可以在https://pan.baidu.com/s/1hrDmvMO下載。
由于時間倉促,書中不妥之處在所難免,敬請讀者指正。希望本書能引起讀者對統(tǒng)計學(xué)和R語言的興趣,在大數(shù)據(jù)時代從數(shù)據(jù)中發(fā)現(xiàn)價值,改善我們的生活。
劉超2019年1月
劉超,中國人民大學(xué)統(tǒng)計學(xué)博士,清華大學(xué)應(yīng)用經(jīng)濟(jì)學(xué)博士后,現(xiàn)為北京航空航天大學(xué)數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院副教授、碩士生導(dǎo)師、副系主任。兼任全國工業(yè)統(tǒng)計學(xué)教學(xué)研究會理事,北京應(yīng)用統(tǒng)計學(xué)會理事,北京大數(shù)據(jù)協(xié)會理事等。近年來主持國家社科基金、教育部人文社科項目、國家稅務(wù)總局項目等多項課題,在國內(nèi)外刊物發(fā)表20余篇論文。獲得寶鋼優(yōu)秀教師獎,北京航空航天大學(xué)藍(lán)天新星等10余項教學(xué)科研獎勵。出版教材和譯著10余本。
第1章緒論
1.1什么是統(tǒng)計學(xué)
1.1.1基本定義
1.1.2基本類型
1.2數(shù)據(jù)和變量
1.2.1變量
1.2.2數(shù)據(jù)
1.3統(tǒng)計軟件
1.3.1R軟件
1.3.2其他常用統(tǒng)計軟件簡介
練習(xí)題
第2章數(shù)據(jù)的描述性分析
2.1單變量數(shù)據(jù)的描述分析
2.1.1分類型數(shù)據(jù)
2.1.2數(shù)值型數(shù)據(jù)
2.2雙變量數(shù)據(jù)的描述分析
2.2.1分類型數(shù)據(jù)對分類型數(shù)據(jù)
2.2.2分類型數(shù)據(jù)對數(shù)值型數(shù)據(jù)
2.2.3數(shù)值型數(shù)據(jù)對數(shù)值型數(shù)據(jù)
2.3多變量數(shù)據(jù)的描述分析
練習(xí)題
第3章概率與分布
3.1隨機(jī)性和規(guī)律性
3.2概率
3.3變量的分布
3.3.1離散型分布
3.3.2連續(xù)型分布
3.4中心極限定理和抽樣分布
3.4.1中心極限定理
3.4.2抽樣分布
3.5分位數(shù)
練習(xí)題
第4章參數(shù)估計
4.1點估計
4.1.1總體、樣本和統(tǒng)計量
4.1.2常用的點估計量
4.1.3估計量的選擇標(biāo)準(zhǔn)
4.2區(qū)間估計
4.2.1正態(tài)分布總體均值的區(qū)間估計
4.2.2獨立正態(tài)分布總體均值差1-2的區(qū)間估計
4.2.3配對正態(tài)分布總體均值差D=1-2的區(qū)間估計
4.2.4總體比例p的區(qū)間估計
4.2.5總體比例之差p1-p2的區(qū)間估計
4.3確定合適的樣本量
練習(xí)題
第5章均值的假設(shè)檢驗
5.1假設(shè)檢驗的基本思想
5.2單個總體均值的假設(shè)檢驗
5.2.1單樣本t檢驗
5.2.2單樣本W(wǎng)ilcoxon符號秩和檢驗
5.3兩個總體均值的假設(shè)檢驗
5.3.1兩樣本t檢驗
5.3.2兩樣本W(wǎng)ilcoxon符號秩和檢驗
5.4配對總體均值的假設(shè)檢驗
5.4.1配對t檢驗
5.4.2配對Wilcoxon符號秩和檢驗
5.5正態(tài)性檢驗
5.6功效與樣本量的計算
5.6.1單樣本t檢驗與配對t檢驗的功效與樣本量
5.6.2兩獨立樣本t檢驗的功效與樣本量
練習(xí)題
第6章比例與列聯(lián)表的假設(shè)檢驗
6.1單個總體的比例
6.2兩個獨立總體的比例
6.3多個總體比例和趨勢檢驗
6.4rc表格
6.5比例的功效與樣本量
練習(xí)題
第7章方差分析
7.1單因素方差分析
7.1.1基本思想
7.1.2成對比較和多重檢驗
7.1.3Bartlett檢驗
7.1.4放寬對方差的假設(shè)
7.1.5KruskalWallis檢驗
7.2雙因素方差分析
7.2.1基本思想
7.2.2無交互作用的雙因素方差分析
7.2.3有交互作用的雙因素方差分析
7.2.4Friedman檢驗
練習(xí)題
第8章一元線性回歸
8.1基本原理
8.1.1基本模型
8.1.2參數(shù)估計
8.2數(shù)據(jù)描述
8.3模型設(shè)定和估計
8.4模型檢驗和評價
8.5殘差與回歸值
8.6預(yù)測與置信區(qū)間
練習(xí)題
第9章多元線性回歸
9.1基本原理
9.2多維數(shù)據(jù)描述
9.3模型設(shè)定和估計
9.4模型檢驗和評價
9.5模型選擇和逐步回歸
9.6多重共線性
9.6.1多重共線性的定義及檢驗
9.6.2逐步回歸
9.6.3嶺回歸
練習(xí)題
第10章簡單時間序列分析
10.1基本概念
10.1.1自相關(guān)
10.1.2白噪聲
10.1.3平穩(wěn)性
10.2時間序列的平滑與分解
10.2.1時間序列的成分
10.2.2時間序列的分解
練習(xí)題
附錄AR的使用
A.1程序包的安裝與加載
A.2數(shù)據(jù)的讀取與保存
A.2.1直接輸入數(shù)據(jù)
A.2.2讀取R包中的自帶數(shù)據(jù)
A.2.3讀取外部數(shù)據(jù)
A.2.4輸出數(shù)據(jù)
A.2.5編輯數(shù)據(jù)
A.3基本的命令與函數(shù)
A.3.1數(shù)據(jù)類型
A.3.2數(shù)據(jù)對象及其運(yùn)算
A.3.3數(shù)據(jù)的合并與拆分
參考文獻(xiàn)