數(shù)據(jù)科學與商業(yè)分析 用機器學習與統(tǒng)計學優(yōu)化商業(yè)決策
定 價:99 元
- 作者:[美] 馬特·塔迪(Matt Taddy)
- 出版時間:2021/3/1
- ISBN:9787115559135
- 出 版 社:人民郵電出版社
- 中圖法分類:TP274
- 頁碼:251
- 紙張:
- 版次:01
- 開本:16開
大數(shù)據(jù)和機器學習等的興起使得商業(yè)分析領域越來越倚重數(shù)據(jù)科學。本書詳細介紹了商業(yè)數(shù)據(jù)科學中的關鍵元素,匯集了機器學習、經(jīng)濟學以及統(tǒng)計學領域的核心原則和最佳實踐,內容涵蓋識別商業(yè)政策中的重要變量、通過實驗測量這些變量,以及挖掘社交媒體以了解公眾對于政策修改的反應,為從事商業(yè)數(shù)據(jù)科學的數(shù)據(jù)科學家和商業(yè)人士提供了必備工具。書中通過大量數(shù)據(jù)分析示例講解如何利用R語言編寫腳本來解決復雜的數(shù)據(jù)科學問題。
1.亞馬遜北美首席經(jīng)濟學家,前芝加哥大學統(tǒng)計學教授帶你解決從數(shù)據(jù)到業(yè)務實操的最后一公里問題;
2.書中通過大量數(shù)據(jù)分析示例講解如何利用R語言編寫腳本來解決復雜的數(shù)據(jù)科學問題;
3.本書是解決數(shù)據(jù)業(yè)務問題的實踐指南,旨在通過大量真實的一線案例,介紹如何將業(yè)務問題和數(shù)據(jù)聯(lián)系起來;
4.本書詳細展示應用統(tǒng)計學+機器學習+經(jīng)濟學進行數(shù)據(jù)分析,進而驅動和優(yōu)化商業(yè)決策的過程。
5.基于R語言。
Matt Taddy,美國經(jīng)濟學家、數(shù)據(jù)科學家,F(xiàn)任亞馬遜北美首席經(jīng)濟學家、大名鼎鼎的亞馬遜經(jīng)濟學家團隊Central Economics Team VP。曾任芝加哥大學布斯商學院計量經(jīng)濟學和統(tǒng)計學教授,明星教師,開創(chuàng)了數(shù)據(jù)科學課程。曾任微軟商務人工智能首席研究員、eBay研究員。
對本書的贊譽
獻詞
前言
常見符號的標準用法
第0章 引言 1
從兩張圖說起 1
大數(shù)據(jù)與機器學習 4
計算 6
第 1章 不確定性 14
1.1 頻率不確定性和bootstrap方法 14
1.2 假設檢驗和錯誤發(fā)現(xiàn)率控制 25
1.3 貝葉斯推斷 33
第 2章 回歸 37
2.1 線性模型 37
2.2 邏輯回歸 46
2.3 偏差與似然 49
2.4 ◆回歸不確定性 53
2.5 空間和時間 56
第3章 正則化 64
3.1 樣本外預測效果 64
3.2 正則化方法 68
3.3 模型選擇 77
3.4 ◆lasso的不確定性量化 87
第4章 分類 94
4.1 最近鄰 94
4.2 概率、成本和分類 97
4.3 多元邏輯回歸 102
4.4 分布式多元回歸 106
4.5 分布式與大數(shù)據(jù) 110
第5章 實驗 114
5.1 隨機控制試驗 115
5.2 近似實驗設計 125
5.3 ◆工具變量 135
第6章 控制 143
6.1 條件可忽略性與線性處理效果 143
6.2 高維混淆變量調整 146
6.3 ◆樣本分割與正交機器學習 148
6.4 異質性處理效果 152
6.5 合成控制法 164
第7章 分解 167
7.1 聚類 167
7.2 因子模型和主成分分析 173
7.3 主成分回歸 180
7.4 偏最小二乘法 184
第8章 文本作為數(shù)據(jù) 189
8.1 分詞 190
8.2 文本回歸 194
8.3 主題模型 194
8.4 多元逆回歸 200
8.5 協(xié)同過濾 204
8.6 詞嵌入技術 206
第9章 非參數(shù)方法 209
9.1 決策樹 210
9.2 隨機森林 216
9.3 因果關系樹 224
9.4 半?yún)?shù)方法與高斯過程 228
第 10章 人工智能 233
10.1 什么是人工智能 233
10.2 通用機器學習 237
10.3 深度學習 240
10.4 ◆SGD 244
10.5 強化學習 248
10.6 商業(yè)環(huán)境中的人工智能 251