概率論與數(shù)理統(tǒng)計(jì)(人工智能專用)
《概率論與數(shù)理統(tǒng)計(jì)(人工智能專用)》介紹了與人工智能密切相關(guān)的概率論與數(shù)理統(tǒng)計(jì)的內(nèi)容。全書分成兩大部分,di一部分主要介紹概率論的知識,涵蓋概率論的基本概念、一維隨機(jī)變量及其分布、二維隨機(jī)變量及其分布,數(shù)字特征,大數(shù)定理和中心極限定理外,還增加了信息論基礎(chǔ)知識、若干集中不等式的相關(guān)知識。第二部分主要介紹常見的數(shù)理統(tǒng)計(jì)知識,包括抽樣分布、參數(shù)估計(jì)(包括貝葉斯估計(jì))、假設(shè)檢驗(yàn)、方差分析。為了滿足機(jī)器學(xué)習(xí)的兩大目標(biāo)任務(wù):分類和預(yù)測,又介紹了回歸分析和聚類分析。還介紹了概率論與數(shù)理統(tǒng)計(jì)的具體知識點(diǎn)在人工智能里的應(yīng)用。在附錄二給出了數(shù)理統(tǒng)計(jì)部分問題的python程序?qū)崿F(xiàn)。在每一章每一小節(jié)后面配備各種題型的習(xí)題。每章后面配備本章的總復(fù)習(xí)題。習(xí)題分為兩類:習(xí)題A可以作為對本章知識內(nèi)容的考察,習(xí)題B中收集了歷年研究生入學(xué)考試試題,有利于考研復(fù)習(xí)。
本書適合從事機(jī)器學(xué)習(xí)的在校學(xué)生、高校研究者使用,也可作為高等理工科院校非數(shù)學(xué)專業(yè)的學(xué)生學(xué)習(xí)概率論與數(shù)理統(tǒng)計(jì)課程的教材使用。
田霞,女,副教授,2005年畢業(yè)于南京航空航天大學(xué),畢業(yè)后在齊魯工業(yè)大學(xué)任教,主要講授《概率論與數(shù)理統(tǒng)計(jì)》《線性代數(shù)》《應(yīng)用密碼學(xué)》等課程。主持校級教研項(xiàng)目2項(xiàng)。
章隨機(jī)事件與概率(1)
節(jié)隨機(jī)事件及樣本空間(1)
一、隨機(jī)現(xiàn)象和樣本空間(1)
二、隨機(jī)事件(3)
三、事件的關(guān)系與運(yùn)算(3)
第二節(jié)概率的定義及性質(zhì)(8)
一、可能性大小的度量(8)
二、概率的統(tǒng)計(jì)定義(8)
三、概率的公理化定義(9)
四、概率的性質(zhì)(9)
第三節(jié)古典概型和幾何概型(12)
一、排列與組合(12)
二、古典概率(13)
三、幾何概型(16)
第四節(jié)條件概率(21)
一、條件概率(21)
二、乘法公式(22)
三、全概率公式(23)
四、貝葉斯公式(25)
第五節(jié)獨(dú)立性(28)
一、獨(dú)立性(28)
二、n重貝努利試驗(yàn)(31)
第二章隨機(jī)變量及其分布(42)
節(jié)離散型隨機(jī)變量及其分布律(42)
一、隨機(jī)變量(42)
二、離散型隨機(jī)變量(43)
三、幾種常見的離散型分布(45)
第二節(jié)隨機(jī)變量的分布函數(shù)(58)
一、分布函數(shù)概念(58)
二、分布函數(shù)的性質(zhì)(58)
第三節(jié)連續(xù)型隨機(jī)變量及其密度函數(shù)(62)
一、連續(xù)型隨機(jī)變量(62)
二、幾種常見的連續(xù)型分布(65)
第四節(jié)隨機(jī)變量函數(shù)的分布(81)
一、離散型隨機(jī)變量函數(shù)的分布(82)
二、連續(xù)型隨機(jī)變量函數(shù)的分布(82)
第三章多維隨機(jī)變量及其分布(95)
節(jié)多維隨機(jī)變量及其聯(lián)合分布(95)
一、二維隨機(jī)變量的聯(lián)合分布函數(shù)(95)
二、二維離散型隨機(jī)變量及其分布(97)
三、二維連續(xù)型隨機(jī)變量及其分布(100)
四、常見的二維分布(102)
第二節(jié)邊緣分布和獨(dú)立性(107)
一、邊緣分布函數(shù)(107)
二、二維離散型隨機(jī)變量(X,Y)的邊緣分布律(108)
三、二維連續(xù)型隨機(jī)變量(X,Y)的邊緣分布(110)
四、隨機(jī)變量的獨(dú)立性(112)
第三節(jié)二維隨機(jī)變量的條件分布和條件獨(dú)立(120)
一、條件分布(120)
二、條件獨(dú)立(123)
第四節(jié)二維隨機(jī)變量函數(shù)的分布(129)
一、二維離散型隨機(jī)變量函數(shù)的分布(129)
二、二維連續(xù)型隨機(jī)變量函數(shù)的分布(131)
三、分布的可加性(135)
四、一些結(jié)論(136)
五、離散型隨機(jī)變量與連續(xù)型隨機(jī)變量和的分布(136)
第四章數(shù)字特征(146)
節(jié)數(shù)學(xué)期望(146)
一、數(shù)學(xué)期望的概念(146)
二、隨機(jī)變量函數(shù)的期望(148)
三、數(shù)學(xué)期望的性質(zhì)(150)
四、數(shù)學(xué)期望性質(zhì)的應(yīng)用(151)
五、一些常用分布的數(shù)學(xué)期望(151)
第二節(jié)方差(157)
一、方差的定義(157)
二、方差的性質(zhì)(158)
三、標(biāo)準(zhǔn)化(159)
四、常用分布的方差(159)
第三節(jié)協(xié)方差及相關(guān)系數(shù)(165)
一、定義(165)
二、協(xié)方差的性質(zhì)(165)
三、相關(guān)系數(shù)的性質(zhì)(165)
第四節(jié)矩和協(xié)方差矩陣(170)
一、矩(170)
二、n維隨機(jī)變量的協(xié)方差矩陣(171)
第五節(jié)信息論基礎(chǔ)(174)
一、自信息(self-infomation)(175)
二、信息熵(Entopy)(175)
三、條件熵(conditional entopy)(177)
四、聯(lián)合熵(joint entopy)(178)
五、相對熵(KL(kull
ack-Lei
le)散度)(178)
六、交叉熵(179)
七、互信息與信息增益(180)
八、優(yōu)選熵原理(182)
第五章大數(shù)定理與中心極限定理(195)
節(jié)集中不等式(195)
一、馬爾可夫不等式(Makov)(195)
二、霍夫丁不等式(Hoeffding)(196)
三、切比雪夫不等式(198)
第二節(jié)大數(shù)定律(201)
一、依概率收斂(201)
二、大數(shù)定理(202)
第三節(jié)中心極限定理(206)
第六章數(shù)理統(tǒng)計(jì)的基本概念(214)
節(jié)總體與樣本(214)
一、總體(215)
二、樣本(215)
三、樣本的聯(lián)合分布(216)
第二節(jié)統(tǒng)計(jì)量及其分布(217)
一、統(tǒng)計(jì)量和抽樣分布(217)
二、抽樣分布(220)
三、正態(tài)總體導(dǎo)出的抽樣分布(225)
第三節(jié)經(jīng)驗(yàn)分布函數(shù)與莖葉圖(231)
一、經(jīng)驗(yàn)分布函數(shù)(231)
二、莖葉圖(232)
第七章參數(shù)估計(jì)(242)
節(jié)點(diǎn)估計(jì)(242)
一、點(diǎn)估計(jì)概念(242)
二、矩估計(jì)(243)
三、極大似然估計(jì)法(245)
第二節(jié)估計(jì)量的評價(jià)準(zhǔn)則(253)
一、無偏性(253)
二、有效性(254)
三、一致性(254)
第三節(jié)貝葉斯估計(jì)(258)
一、統(tǒng)計(jì)推斷中可用的三種信息(258)
二、先驗(yàn)分布和后驗(yàn)分布(259)
三、先驗(yàn)分布的尋找(264)
第四節(jié)區(qū)間估計(jì)(267)
一、區(qū)間估計(jì)的基本概念(267)
二、單個(gè)正態(tài)總體參數(shù)的區(qū)間估計(jì)(268)
三、兩個(gè)正態(tài)總體參數(shù)的區(qū)間估計(jì)(270)
四、分類精度的置信區(qū)間(272)
第八章假設(shè)檢驗(yàn)(283)
節(jié)假設(shè)檢驗(yàn)的基本思想(283)
一、檢驗(yàn)的依據(jù):實(shí)際推斷原理(283)
二、假設(shè)檢驗(yàn)的基本概念(283)
三、檢驗(yàn)的p值(尾概率)(286)
四、假設(shè)檢驗(yàn)的基本步驟(286)
第二節(jié)正態(tài)總體下的參數(shù)假設(shè)檢驗(yàn)(287)
一、單個(gè)正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)(287)
二、兩個(gè)正態(tài)總體的假設(shè)檢驗(yàn)(290)
三、大樣本下非正態(tài)總體下的參數(shù)型假設(shè)檢驗(yàn)(295)
第三節(jié)非參數(shù)假設(shè)檢驗(yàn)(300)
一、擬合優(yōu)度檢驗(yàn)(300)
二、獨(dú)立性檢驗(yàn)(303)
三、秩和檢驗(yàn)(305)
第九章方差分析(315)
節(jié)單因素方差分析(315)
一、問題的提出(315)
二、建立統(tǒng)計(jì)模型(316)
三、平方和分解(317)
四、離差平方和的分布(319)
五、假設(shè)檢驗(yàn)(320)
六、參數(shù)估計(jì)(321)
第二節(jié)雙因素方差分析(324)
一、無交互作用的雙因素方差分析(325)
二、有交互作用的雙因素方差分析(329)
第十章回歸分析(342)
節(jié)一元線性回歸分析(343)
一、一元線性回歸的數(shù)學(xué)模型(343)
二、回歸系數(shù)的最小二乘估計(jì)(344)
三、回歸問題的統(tǒng)計(jì)檢驗(yàn)(346)
四、估計(jì)和預(yù)測(349)
第二節(jié)非線性回歸(353)
一、指數(shù)曲線(353)
二、對數(shù)函數(shù)曲線(354)
三、冪函數(shù)曲線(354)
四、雙曲函數(shù)曲線(355)
五、S型曲線(356)
六、多項(xiàng)式曲線(357)
第十一章聚類分析(364)
節(jié)聚類分析的一般問題(364)
一、相似性度量(365)
二、類及其特征(370)
第二節(jié)系統(tǒng)聚類法(371)
一、系統(tǒng)聚類法的基本思想(371)
二、系統(tǒng)聚類的方法(372)
三、分類數(shù)的確定(386)
第三節(jié)k-均值聚類算法(388)
一、k-均值算法簡介(389)
二、k-均值算法實(shí)現(xiàn)步驟(389)
三、k-均值算法的優(yōu)缺點(diǎn)(393)
附錄一(397)
附錄二數(shù)理統(tǒng)計(jì)內(nèi)容的python實(shí)現(xiàn)(413)
一、假設(shè)檢驗(yàn)(413)
二、方差分析(423)
三、回歸分析(430)
四、聚類分析(434)
習(xí)題參考答案(437)
參考文獻(xiàn)(462)