數(shù)據(jù)思維——從數(shù)據(jù)分析到商業(yè)價值(第2版)
定 價:139 元
- 作者:王漢生 等
- 出版時間:2024/1/1
- ISBN:9787300322674
- 出 版 社:中國人民大學(xué)出版社
- 中圖法分類:TP274
- 頁碼:376
- 紙張:
- 版次:2
- 開本:異16
本書由微信公眾號“狗熊會”(ID: CluBear)創(chuàng)始人王漢生教授(熊大)及其核心團隊聯(lián)合創(chuàng)作完成。本書可以被看作商業(yè)分析領(lǐng)域入門級通俗且有趣的讀物,深入淺出,雅俗共賞,適合數(shù)據(jù)分析師、工程師、產(chǎn)品經(jīng)理、銷售人員、商務(wù)拓展人員以及數(shù)據(jù)企業(yè)高管閱讀。
本書主要由六章組成。第一章介紹了熊大樸素的數(shù)據(jù)價值觀,解讀數(shù)據(jù)與價值的邏輯關(guān)系;第二章介紹了最基本的數(shù)據(jù)可視化方法(統(tǒng)計圖表)的規(guī)范與有趣應(yīng)用;第三章介紹了回歸分析,通過精彩案例展示了如何將一個業(yè)務(wù)問題定義成一個數(shù)據(jù)可分析問題;第四章介紹了機器學(xué)習(xí),可以看作對第三章技術(shù)上的一個重要補充;第五章展示了各種常見的非結(jié)構(gòu)化數(shù)據(jù)(文本、圖像)分析的有趣案例;第六章介紹了數(shù)據(jù)合規(guī)的相關(guān)內(nèi)容。
王漢生,北京大學(xué)光華管理學(xué)院商務(wù)統(tǒng)計與經(jīng)濟計量系教授、博士生導(dǎo)師。曾獲國家杰出青年科學(xué)基金項目資助。教育部“長江學(xué)者”特聘教授,全國工業(yè)統(tǒng)計學(xué)教學(xué)研究會青年統(tǒng)計學(xué)家協(xié)會創(chuàng)始會長,美國數(shù)理統(tǒng)計學(xué)會(IMS)會員,美國統(tǒng)計協(xié)會(ASA)會員,國際統(tǒng)計學(xué)會(ISI)當選會員。歷任9種國際學(xué)術(shù)期刊副主編。在國內(nèi)外各種專業(yè)刊物上發(fā)表文章100余篇,與人合著英文專著1本,與人合著中文教材4本。愛思唯爾中國高被引學(xué)者(數(shù)學(xué)類,2014—2019年;應(yīng)用經(jīng)濟學(xué)類,2020年;統(tǒng)計學(xué)類,2021—2022年)。主要研究領(lǐng)域為變量選擇、數(shù)據(jù)降維、高維數(shù)據(jù)分析以及復(fù)雜網(wǎng)絡(luò)數(shù)據(jù)分析,所有這些研究都以大規(guī)模、復(fù)雜、超高維數(shù)據(jù)分析為核心,其相關(guān)應(yīng)用領(lǐng)域包括但不局限于中文文本、網(wǎng)絡(luò)結(jié)構(gòu)、位置軌跡。
曾擔任博雅立方科技有限公司首席科學(xué)家(2009—2015年)、百分點首席統(tǒng)計學(xué)家(2015年至今)。此外,和量邦科技、考拉征信、彩虹無線、蓬景數(shù)字、西門子、三一重工、格靈深瞳、天罡儀表、廣聯(lián)達等眾多企業(yè)有聯(lián)合研究工作,涉及量化投資、互聯(lián)網(wǎng)征信、車聯(lián)網(wǎng)、移動設(shè)備廣告實時競價、搜索引擎營銷、電子商務(wù)、重裝制造業(yè)等多個重要行業(yè)。
緒 論 大數(shù)據(jù)時代之“皇帝的新裝”
第一章 樸素的數(shù)據(jù)價值觀
什么是數(shù)據(jù)?
數(shù)據(jù)的商業(yè)價值
數(shù)據(jù)到價值的轉(zhuǎn)化:回歸分析的道與術(shù)
弄清客戶需求
關(guān)于p值的爭論與思考
第二章 數(shù)據(jù)可視化
實力派:準確+有效
偶像派:簡潔+美觀
柱狀圖
堆積柱狀圖
柱狀圖之妙用
餅 圖
直方圖
折線圖
散點圖
箱線圖
莖葉圖
統(tǒng)計表
第三章 回歸分析
什么是回歸分析?
線性回歸:北京市二手房房價影響因素分析
線性回歸:電影票房影響因素分析
線性回歸:數(shù)據(jù)分析崗位招聘情況解析
0-1回歸:某移動通信公司客戶流失預(yù)警分析
0-1回歸:車險數(shù)據(jù)分析與商業(yè)價值
0-1回歸:點擊率預(yù)測在RTB廣告投放中的應(yīng)用
定序回歸:信用卡逾期數(shù)據(jù)分析
計數(shù)回歸:英超進球誰最強
生存回歸:新產(chǎn)品在架時長研究
第四章 機器學(xué)習(xí)
樸素貝葉斯:政府熱線電話
樸素貝葉斯:基于商品名稱的多分類問題
決策樹:什么因素決定非誠勿擾
決策樹:二手車保值比率
回歸樹與提升算法:旅游產(chǎn)品銷量影響因素
深度學(xué)習(xí):圖像自動識別
深度學(xué)習(xí):LSTM模型自動作曲
深度學(xué)習(xí):打麻將
聚類分析:狗熊牌皮鞋的廣告投放
第五章 非結(jié)構(gòu)化數(shù)據(jù) 245
文本分析:《瑯琊榜》的小說三要素
文本分析:《倚天屠龍記》
文本分析:從用戶評論看產(chǎn)品改善
文本分析:網(wǎng)易云音樂評論數(shù)據(jù)分析
網(wǎng)絡(luò)結(jié)構(gòu)數(shù)據(jù):《甄嬛傳》中的愛恨情仇
網(wǎng)絡(luò)結(jié)構(gòu)數(shù)據(jù):統(tǒng)計期刊合作者社區(qū)發(fā)現(xiàn)
圖像數(shù)據(jù):通過圖片識別PM2.5
第六章 數(shù)據(jù)合規(guī)
我國cookie隱私第一案
“被遺忘權(quán)”第一案
數(shù)據(jù)安全第一案