數(shù)據(jù)挖掘與數(shù)據(jù)化運營實戰(zhàn):思路、方法、技巧與應(yīng)用
定 價:59 元
叢書名:大數(shù)據(jù)技術(shù)叢書
- 作者:盧輝 著
- 出版時間:2013/6/1
- ISBN:9787111426509
- 出 版 社:機械工業(yè)出版社
- 中圖法分類:TP274
- 頁碼:276
- 紙張:膠版紙
- 版次:1
- 開本:16開
《數(shù)據(jù)挖掘與數(shù)據(jù)化運營實戰(zhàn):思路、方法、技巧與應(yīng)用》是目前有關(guān)數(shù)據(jù)挖掘在數(shù)據(jù)化運營實踐領(lǐng)域比較全面和系統(tǒng)的著作,也是諸多數(shù)據(jù)挖掘書籍中為數(shù)不多的穿插大量真實的實踐應(yīng)用案例和場景的著作,更是創(chuàng)造性地針對數(shù)據(jù)化運營中不同分析挖掘課題類型,推出一一對應(yīng)的分析思路集錦和相應(yīng)的分析技巧集成,為讀者提供“菜單化”實戰(zhàn)錦囊的著作。作者結(jié)合自己數(shù)據(jù)化運營實踐中大量的項目經(jīng)驗,用通俗易懂的“非技術(shù)”語言和大量活潑生動的案例,圍繞數(shù)據(jù)分析挖掘中的思路、方法、技巧與應(yīng)用,全方位整理、總結(jié)、分享,幫助讀者深刻領(lǐng)會和掌握“以業(yè)務(wù)為核心,以思路為重點,以分析技術(shù)為輔佐”的數(shù)據(jù)挖掘?qū)嵺`應(yīng)用寶典。
《數(shù)據(jù)挖掘與數(shù)據(jù)化運營實戰(zhàn):思路、方法、技巧與應(yīng)用》共19章,分為三個部分:基礎(chǔ)篇(第1~4章)系統(tǒng)介紹了數(shù)據(jù)分析挖掘和數(shù)據(jù)化運營的相關(guān)背景、數(shù)據(jù)化運營中“協(xié)調(diào)配合”的核心,以及實踐中常見分析項目類型;實戰(zhàn)篇(第6~13章)主要介紹實踐中常見的分析挖掘技術(shù)的實用技巧,并對大量的實踐案例進(jìn)行了全程分享展示;思想意識篇(第5章,第14~19章)主要是有關(guān)數(shù)據(jù)分析師的責(zé)任、意識、思維的培養(yǎng)和提升的總結(jié)和探索,以及一些有效的項目質(zhì)控制度和經(jīng)典的方法論介紹。
阿里巴巴資深數(shù)據(jù)分析專家盧輝撰寫,多年數(shù)據(jù)挖掘應(yīng)用實踐的經(jīng)驗結(jié)晶 實戰(zhàn)性強,從數(shù)據(jù)分析師的角度對商業(yè)實戰(zhàn)進(jìn)行了總結(jié)和歸納,以大量事實和案例展現(xiàn)了“以業(yè)務(wù)為核心,以思路為重點,以挖掘技術(shù)為輔佐”的數(shù)據(jù)挖掘商業(yè)實踐
為什么要寫這本書
自從2002年第一次接觸 “數(shù)據(jù)挖掘”(Data Mining)這個新名詞以來,轉(zhuǎn)眼之間我已經(jīng)在數(shù)據(jù)挖掘商業(yè)應(yīng)用相關(guān)領(lǐng)域度過了11年。這11年里我既見識了國外數(shù)據(jù)挖掘商業(yè)應(yīng)用如火如荼地開展;又經(jīng)歷了從21世紀(jì)開始,國內(nèi)企業(yè)在數(shù)據(jù)挖掘商業(yè)應(yīng)用中的摸索起步,到如今方興未艾的局面;更有幸在經(jīng)歷了傳統(tǒng)行業(yè)的數(shù)據(jù)挖掘商業(yè)應(yīng)用之后,投身到互聯(lián)網(wǎng)行業(yè)(當(dāng)今數(shù)據(jù)分析商業(yè)應(yīng)用熱火朝天、發(fā)展最快,并且對數(shù)據(jù)和數(shù)據(jù)挖掘的商業(yè)應(yīng)用依賴性最強的行業(yè))的數(shù)據(jù)挖掘商業(yè)實踐中。這11年是我職業(yè)生涯中最為重要的一段時光,從個人生存的角度來說,我找到了謀生和養(yǎng)家糊口的飯碗—數(shù)據(jù)挖掘工作;從個人歸屬的角度來說,我很幸運地碰到了職業(yè)與興趣的重合點。
在國內(nèi),“數(shù)據(jù)挖掘”作為一門復(fù)合型應(yīng)用學(xué)科,其在商業(yè)領(lǐng)域的實踐應(yīng)用及推廣只有十幾年的時間,在此期間,國內(nèi)雖然陸續(xù)出版了一些相關(guān)的書籍,但是絕大多數(shù)都是基于理論或者國外經(jīng)驗來闡述的,少有針對國內(nèi)企業(yè)相關(guān)商業(yè)實戰(zhàn)的詳細(xì)介紹和分享,更缺乏從數(shù)據(jù)分析師的角度對商業(yè)實戰(zhàn)所進(jìn)行的總結(jié)和歸納。因此,從商業(yè)應(yīng)用出發(fā),基于大量的商業(yè)實戰(zhàn)案例而不是基于理論探討的數(shù)據(jù)挖掘應(yīng)用書籍成為當(dāng)今圖書市場和廣大“數(shù)據(jù)挖掘”學(xué)習(xí)者的共同需求。
同時,在有幸與數(shù)據(jù)挖掘商業(yè)實踐相伴11年之后,我也想稍微放慢些腳步,正如一段長途跋涉之后需要停下腳步,整理一路經(jīng)歷的收獲和感悟一樣,我希望將自己一路走來的心得與體會、經(jīng)驗與教訓(xùn)、挫折與成績整理出來。
基于以上原因,我決定從數(shù)據(jù)挖掘的商業(yè)需求和商業(yè)實戰(zhàn)出發(fā),結(jié)合我10多年來在不同行業(yè)(尤其是最近4年在互聯(lián)網(wǎng)行業(yè))的大量數(shù)據(jù)挖掘商業(yè)實戰(zhàn)項目,將自己這些年來積累的經(jīng)驗和總結(jié)分享出來,希望能夠起到拋磚引玉的作用,為對數(shù)據(jù)挖掘商業(yè)實踐感興趣的朋友、愛好者、數(shù)據(jù)分析師提供點滴的參考和借鑒。同時,鑒于“數(shù)據(jù)化運營”在當(dāng)今大數(shù)據(jù)時代已經(jīng)成為眾多(以后必將越來越多)現(xiàn)代企業(yè)的普遍經(jīng)營戰(zhàn)略,相信本書所分享的大量有關(guān)數(shù)據(jù)化運營的商業(yè)實踐項目也可以為企業(yè)的管理層、決策層提供一定程度的參考和借鑒。
我相信,本書總結(jié)的心得與體會,可以推動自己今后的工作,會成為我的財富;同時,這些心得與體會對于部分?jǐn)?shù)據(jù)分析師來說也可以起到不同程度的參考和借鑒作用;對于廣大對數(shù)據(jù)挖掘商業(yè)應(yīng)用感興趣的初學(xué)者來說也未嘗不是一種寶貴經(jīng)驗。
我是從機械制造工藝與設(shè)備這個與“數(shù)據(jù)挖掘”八竿子打不著的專業(yè)轉(zhuǎn)行到數(shù)據(jù)挖掘商業(yè)應(yīng)用行業(yè)的,這與目前國內(nèi)絕大多數(shù)的數(shù)據(jù)分析挖掘?qū)I(yè)人士的背景有較大差別(國內(nèi)絕大多數(shù)數(shù)據(jù)分析挖掘?qū)I(yè)人士主要來自統(tǒng)計專業(yè)、數(shù)學(xué)專業(yè)或者計算機專業(yè))。我的職業(yè)道路很曲折,之所以放棄了自己沒興趣的機械制造工藝與設(shè)備專業(yè),是因為自己喜歡市場營銷。有幸在國外學(xué)習(xí)市場營銷專業(yè)時了解并親近了國外市場營銷中的核心和基石—市場營銷信息學(xué)(Marketing Informatics)。當(dāng)然,這是國外10多年前的說法,換成行業(yè)內(nèi)與時俱進(jìn)的新說法,就是時下耳熟能詳?shù)摹皵?shù)據(jù)分析挖掘在市場營銷領(lǐng)域的商業(yè)實踐應(yīng)用”)。說這么多,其實只是想告訴有緣的對數(shù)據(jù)挖掘商業(yè)實踐感興趣的朋友, “以業(yè)務(wù)為核心,以思路為重點,以挖掘技術(shù)為輔佐”就是該領(lǐng)域的有效成長之路。
很多初學(xué)者總以為掌握了某些分析軟件,就可以成為數(shù)據(jù)分析師。其實,一個成功的數(shù)據(jù)挖掘商業(yè)實踐,核心的因素不是技術(shù),而是業(yè)務(wù)理解和分析思路。本書自始至終都在力圖用大量的事實和案例來證明“以業(yè)務(wù)為核心,以思路為重點,以挖掘技術(shù)為輔佐”才是數(shù)據(jù)挖掘商業(yè)實踐成功的寶典。
另外,現(xiàn)代企業(yè)面對大數(shù)據(jù)時代的數(shù)據(jù)化運營絕不僅僅是數(shù)據(jù)分析部門和數(shù)據(jù)分析師的事情,它需要企業(yè)各部門的共同參與,更需要企業(yè)決策層的支持和推動。
讀者對象
對數(shù)據(jù)分析和數(shù)據(jù)挖掘的商業(yè)實踐感興趣的大專院校師生、對其感興趣的初學(xué)者。
互聯(lián)網(wǎng)行業(yè)對數(shù)據(jù)分析挖掘商業(yè)實踐感興趣的運營人員以及其他專業(yè)的人士。
實施數(shù)據(jù)化運營的現(xiàn)代企業(yè)的運營人員以及其他專業(yè)的人士,尤其是企業(yè)的管理者、決策者(數(shù)據(jù)化運營戰(zhàn)略的制定者和推動者)。
各行各業(yè)的數(shù)據(jù)分析師、數(shù)據(jù)挖掘師。
勘誤和支持
由于作者水平和能力有限,編寫時間倉促,不妥之處在所難免,在此懇請讀者批評指正。作者有關(guān)數(shù)據(jù)挖掘商業(yè)實踐應(yīng)用的專業(yè)博客 “數(shù)據(jù)挖掘 人在旅途”地址為http://shzxqdj.blog.163.com,歡迎讀者和數(shù)據(jù)挖掘商業(yè)實踐的愛好者不吝賜教。另外,如果您有關(guān)于數(shù)據(jù)挖掘商業(yè)實踐的任何話題,也可以發(fā)送郵件到郵箱 chinadmer@163.com ,期待你們的反饋意見。
如何閱讀本書
本書分為19章。
第1~4章為基礎(chǔ)和背景部分,主要介紹數(shù)據(jù)分析挖掘和數(shù)據(jù)化運營的相關(guān)背景、數(shù)據(jù)化運營中“協(xié)調(diào)配合”的本質(zhì),以及實踐中常見的分析項目類型。
第6~13章是數(shù)據(jù)分析挖掘中的具體技巧和案例分享部分,主要介紹實踐中常見的分析挖掘技術(shù)的實用技巧,并對大量的實踐案例進(jìn)行了全程分享展示。
第5章,第14~19章是有關(guān)數(shù)據(jù)分析師的責(zé)任、意識、思維的培養(yǎng)和提升的總結(jié)與探索,以及一些有效的項目質(zhì)控制度和經(jīng)典的方法論。
本書幾乎每章都會用至少一個完整翔實的實戰(zhàn)案例來進(jìn)行說明、反復(fù)強化“以業(yè)務(wù)為核心,以思路為重點,以挖掘技術(shù)為輔佐”,希望能給讀者留下深刻印象,因為這是數(shù)據(jù)挖掘商業(yè)實踐成功的寶典。
致謝
首先要感謝機械工業(yè)出版社華章公司的楊繡國(Lisa)編輯,沒有您的首倡和持續(xù)的鼓勵,我不會想到要寫這樣一本來自實踐的書,也不會順利地完成這本書。寫作過程中,您的幫助讓我對“編輯”這個職業(yè)有了新的認(rèn)識,編輯就是作者背后的無名英雄。在本書出版之際,我向Lisa表達(dá)我深深的感謝和祝福。同時感謝朱秀英編輯在本書后期編輯過程中付出的辛勞,您的專業(yè)、敬業(yè)和細(xì)心使得書稿中諸多不完善之處得以修正和提高。
作為一名30多歲才從機械工程師轉(zhuǎn)行,進(jìn)入數(shù)據(jù)挖掘及其商業(yè)實踐的遲到者,我在數(shù)據(jù)挖掘的道路上一路走來,得到了無數(shù)貴人的幫助和提攜。
感謝我的啟蒙導(dǎo)師,加拿大Dalhousie University的數(shù)據(jù)挖掘課程教授Tony Schellinck。他風(fēng)趣幽默的授課風(fēng)格,嚴(yán)謹(jǐn)扎實的專業(yè)功底,隨手拈來的大量親身經(jīng)歷的商業(yè)實戰(zhàn)案例,以及對待學(xué)生的耐心和熱情,讓我作為一名外國學(xué)生能有效克服語言和生活環(huán)境的挑戰(zhàn),比較順利地進(jìn)入數(shù)據(jù)挖掘的職業(yè)發(fā)展道路。
感謝回國后給我第一份專業(yè)工作機會的前CCG集團(Communication Central Group)商業(yè)智能應(yīng)用事業(yè)部總經(jīng)理Justin Jencks。中國通Justin在我們一起共事的那段日子里,果敢放手讓我嘗試多個跨行業(yè)的探索性商業(yè)應(yīng)用項目,給了我許多寶貴的機會,使我迅速熟悉本土市場,積累了不同行業(yè)的實戰(zhàn)案例,這些對我的專業(yè)成長非常重要。
感謝4年前給我機會,讓我得以從傳統(tǒng)行業(yè)進(jìn)入互聯(lián)網(wǎng)行業(yè)的阿里巴巴集團ITBU事業(yè)部的前商業(yè)智能部門總監(jiān)李紅偉(菠蘿)。進(jìn)入互聯(lián)網(wǎng)行業(yè)之后,我才深深懂得作為一名數(shù)據(jù)分析師,相比傳統(tǒng)行業(yè)來說,互聯(lián)網(wǎng)行業(yè)有太多的機會可以去嘗試不同的項目,去親歷數(shù)不清的“一竿子插到底”的落地應(yīng)用,去學(xué)習(xí)面對日新月異的需求和挑戰(zhàn)。
感謝一路走來,在項目合作和交流中給我?guī)椭椭С值母魑磺拜叀㈩I(lǐng)導(dǎo)、朋友和伙伴,包括:上海第一醫(yī)藥連鎖經(jīng)營有限公司總經(jīng)理顧詠晟先生、新華信國際信息咨詢北京有限公司副總裁歐萬德先生(Alvin)、上海聯(lián)都集團的創(chuàng)始人馮鐵軍先生、上海通方管理咨詢有限公司總經(jīng)理李步峰女士和總監(jiān)張國安先生、鼎和保險公司的張霖霏先生、盛大文學(xué)的數(shù)據(jù)分析經(jīng)理張仙鶴先生、途牛網(wǎng)高級運營專家焦延伍先生,以及來自阿里巴巴的數(shù)據(jù)分析團隊的領(lǐng)導(dǎo)和伙伴(資深總監(jiān)車品覺先生、高級專家范國棟先生、資深經(jīng)理張高峰先生、數(shù)據(jù)分析專家樊寧先生、資深數(shù)據(jù)分析師曹俊杰先生、數(shù)據(jù)分析師宮尚寶先生,等等,尤其要感謝阿里巴巴數(shù)據(jù)委員會會長車品覺老師在百忙中熱情地為本書作推薦序,并在序言里為廣大讀者分享了數(shù)據(jù)分析師當(dāng)前面臨的最新機遇和挑戰(zhàn)),以及這個倉促列出的名單之外的更多前輩、領(lǐng)導(dǎo)、朋友和伙伴。
感謝我的父母、姐姐、姐夫和外甥,他們給予了我一貫的支持和鼓勵。
我將把深深的感謝給予我的妻子王艷和女兒露璐。露璐雖然只是初中一年級的學(xué)生,但是在本書的寫作過程中,她多次主動放棄外出玩耍,幫我改稿,給我提建議,給我鼓勵,甚至還為本書設(shè)計了一款封面,在此向露璐同學(xué)表達(dá)我衷心的感謝!而我的妻子,則將家里的一切事情打理得井井有條,使我可以將充分的時間和精力投入本書的寫作中。謹(jǐn)以此書獻(xiàn)給她們!
盧輝
中國 杭州
盧輝,阿里巴巴商業(yè)智能部數(shù)據(jù)分析專家,從事數(shù)據(jù)庫營銷和數(shù)據(jù)化運營分析多年,曾在不同行業(yè)以商務(wù)拓展(BD)經(jīng)理、項目經(jīng)理、市場營銷部經(jīng)理、高級咨詢顧問、數(shù)據(jù)分析專家的身份親歷大量的數(shù)據(jù)庫營銷和互聯(lián)網(wǎng)行業(yè)數(shù)據(jù)化運營應(yīng)用項目。目前在阿里巴巴主要從事數(shù)據(jù)化運營的數(shù)據(jù)挖掘規(guī)劃、項目管理、實施,擁有比較豐富的互聯(lián)網(wǎng)行業(yè)數(shù)據(jù)化運營項目經(jīng)驗。關(guān)注數(shù)據(jù)化運營的規(guī)劃和數(shù)據(jù)挖掘項目的管理。
推薦序
前言
第1章 什么是數(shù)據(jù)化運營
1.1 現(xiàn)代營銷理論的發(fā)展歷程
1.1.1 從4P到4C
1.1.2 從4C到3P3C
1.2 數(shù)據(jù)化運營的主要內(nèi)容
1.3 為什么要數(shù)據(jù)化運營
1.4 數(shù)據(jù)化運營的必要條件
1.4.1 企業(yè)級海量數(shù)據(jù)存儲的實現(xiàn)
1.4.2 精細(xì)化運營的需求
1.4.3 數(shù)據(jù)分析和數(shù)據(jù)挖掘技術(shù)的有效應(yīng)用
1.4.4 企業(yè)決策層的倡導(dǎo)與持續(xù)支持
1.5 數(shù)據(jù)化運營的新現(xiàn)象與新發(fā)展
1.6 關(guān)于互聯(lián)網(wǎng)和電子商務(wù)的最新數(shù)據(jù)
第2章 數(shù)據(jù)挖掘概述
2.1 數(shù)據(jù)挖掘的發(fā)展歷史
2.2 統(tǒng)計分析與數(shù)據(jù)挖掘的主要區(qū)別
2.3 數(shù)據(jù)挖掘的主要成熟技術(shù)以及在數(shù)據(jù)化運營中的主要應(yīng)用
2.3.1 決策樹
2.3.2 神經(jīng)網(wǎng)絡(luò)
2.3.3 回歸
2.3.4 關(guān)聯(lián)規(guī)則
2.3.5 聚類
2.3.6 貝葉斯分類方法
2.3.7 支持向量機
2.3.8 主成分分析
2.3.9 假設(shè)檢驗
2.4 互聯(lián)網(wǎng)行業(yè)數(shù)據(jù)挖掘應(yīng)用的特點
第3章 數(shù)據(jù)化運營中常見的數(shù)據(jù)分析項目類型
3.1 目標(biāo)客戶的特征分析
3.2 目標(biāo)客戶的預(yù)測(響應(yīng)、分類)模型
3.3 運營群體的活躍度定義
3.4 用戶路徑分析
3.5 交叉銷售模型
3.6 信息質(zhì)量模型
3.7 服務(wù)保障模型
3.8 用戶(買家、賣家)分層模型
3.9 賣家(買家)交易模型
3.10 信用風(fēng)險模型
3.11 商品推薦模型
3.11.1 商品推薦介紹
3.11.2 關(guān)聯(lián)規(guī)則
3.11.3 協(xié)同過濾算法
3.11.4 商品推薦模型總結(jié)
3.12 數(shù)據(jù)產(chǎn)品
3.13 決策支持
第4章 數(shù)據(jù)化運營是跨專業(yè)、跨團隊的協(xié)調(diào)與合作
4.1 數(shù)據(jù)分析團隊與業(yè)務(wù)團隊的分工和定位
4.1.1 提出業(yè)務(wù)分析需求并且能勝任基本的數(shù)據(jù)分析
4.1.2 提供業(yè)務(wù)經(jīng)驗和參考建議
4.1.3 策劃和執(zhí)行精細(xì)化運營方案
4.1.4 跟蹤運營效果、反饋和總結(jié)
4.2 數(shù)據(jù)化運營是真正的多團隊、多專業(yè)的協(xié)同作業(yè)
4.3 實例示范數(shù)據(jù)化運營中的跨專業(yè)、跨團隊協(xié)調(diào)合作
第5章 分析師常見的錯誤觀念和對治的管理策略
5.1 輕視業(yè)務(wù)論
5.2 技術(shù)萬能論
5.3 技術(shù)尖端論
5.4 建模與應(yīng)用兩段論
5.5 機器萬能論
5.6 幸福的家庭都是相似的,不幸的家庭各有各的不幸
第6章 數(shù)據(jù)挖掘項目完整應(yīng)用案例演示
6.1 項目背景和業(yè)務(wù)分析需求的提出
6.2 數(shù)據(jù)分析師參與需求討論
6.3 制定需求分析框架和分析計劃
6.4 抽取樣本數(shù)據(jù)、熟悉數(shù)據(jù)、數(shù)據(jù)清洗和摸底
6.5 按計劃初步搭建挖掘模型
6.6 與業(yè)務(wù)方討論模型的初步結(jié)論,提出新的思路和模型優(yōu)化方案
6.7 按優(yōu)化方案重新抽取樣本并建模,提煉結(jié)論并驗證模型
6.8 完成分析報告和落地應(yīng)用建議
6.9 制定具體的落地應(yīng)用方案和評估方案
6.10 業(yè)務(wù)方實施落地應(yīng)用方案并跟蹤、評估效果
6.11 落地應(yīng)用方案在實際效果評估后,不斷修正完善
6.12 不同運營方案的評估、總結(jié)和反饋
6.13 項目應(yīng)用后的總結(jié)和反思
第7章 數(shù)據(jù)挖掘建模的優(yōu)化和限度
7.1 數(shù)據(jù)挖掘模型的優(yōu)化要遵循有效、適度的原則
7.2 如何有效地優(yōu)化模型
7.2.1 從業(yè)務(wù)思路上優(yōu)化
7.2.2 從建模的技術(shù)思路上優(yōu)化
7.2.3 從建模的技術(shù)技巧上優(yōu)化
7.3 如何思考優(yōu)化的限度
7.4 模型效果評價的主要指標(biāo)體系
7.4.1 評價模型準(zhǔn)確度和精度的系列指標(biāo)
7.4.2 ROC曲線
7.4.3 KS值
7.4.4 Lift值
7.4.5 模型穩(wěn)定性的評估
第8章 常見的數(shù)據(jù)處理技巧
8.1 數(shù)據(jù)的抽取要正確反映業(yè)務(wù)需求
8.2 數(shù)據(jù)抽樣
8.3 分析數(shù)據(jù)的規(guī)模有哪些具體的要求
8.4 如何處理缺失值和異常值
8.4.1 缺失值的常見處理方法
8.4.2 異常值的判斷和處理
8.5 數(shù)據(jù)轉(zhuǎn)換
8.5.1 生成衍生變量
8.5.2 改善變量分布的轉(zhuǎn)換
8.5.3 分箱轉(zhuǎn)換
8.5.4 數(shù)據(jù)的標(biāo)準(zhǔn)化
8.6 篩選有效的輸入變量
8.6.1 為什么要篩選有效的輸入變量
8.6.2 結(jié)合業(yè)務(wù)經(jīng)驗進(jìn)行先行篩選
8.6.3 用線性相關(guān)性指標(biāo)進(jìn)行初步篩選
8.6.4 R平方
8.6.5 卡方檢驗
8.6.6 IV和WOE
8.6.7 部分建模算法自身的篩選功能
8.6.8 降維的方法
8.6.9 最后的準(zhǔn)則
8.7 共線性問題
8.7.1 如何發(fā)現(xiàn)共線性
8.7.2 如何處理共線性
第9章 聚類分析的典型應(yīng)用和技術(shù)小竅門
9.1 聚類分析的典型應(yīng)用場景
9.2 主要聚類算法的分類
9.2.1 劃分方法
9.2.2 層次方法
9.2.3 基于密度的方法
9.2.4 基于網(wǎng)格的方法
9.3 聚類分析在實踐應(yīng)用中的重點注意事項
9.3.1 如何處理數(shù)據(jù)噪聲和異常值
9.3.2 數(shù)據(jù)標(biāo)準(zhǔn)化
9.3.3 聚類變量的少而精
9.4 聚類分析的擴展應(yīng)用
9.4.1 聚類的核心指標(biāo)與非聚類的業(yè)務(wù)指標(biāo)相輔相成
9.4.2 數(shù)據(jù)的探索和清理工具
9.4.3 個性化推薦的應(yīng)用
9.5 聚類分析在實際應(yīng)用中的優(yōu)勢和缺點
9.6 聚類分析結(jié)果的評價體系和評價指標(biāo)
9.6.1 業(yè)務(wù)專家的評估
9.6.2 聚類技術(shù)上的評價指標(biāo)
9.7 一個典型的聚類分析課題的案例分享
9.7.1 案例背景
9.7.2 基本的數(shù)據(jù)摸底
9.7.3 基于用戶樣本的聚類分析的初步結(jié)論
第10章 預(yù)測響應(yīng)(分類)模型的典型應(yīng)用和技術(shù)小竅門
10.1 神經(jīng)網(wǎng)絡(luò)技術(shù)的實踐應(yīng)用和注意事項
10.1.1 神經(jīng)網(wǎng)絡(luò)的原理和核心要素
10.1.2 神經(jīng)網(wǎng)絡(luò)的應(yīng)用優(yōu)勢
10.1.3 神經(jīng)網(wǎng)絡(luò)技術(shù)的缺點和注意事項
10.2 決策樹技術(shù)的實踐應(yīng)用和注意事項
10.2.1 決策樹的原理和核心要素
10.2.2 CHAID算法
10.2.3 CART算法
10.2.4 ID3算法
10.2.5 決策樹的應(yīng)用優(yōu)勢
10.2.6 決策樹的缺點和注意事項
10.3 邏輯回歸技術(shù)的實踐應(yīng)用和注意事項
10.3.1 邏輯回歸的原理和核心要素
10.3.2 回歸中的變量篩選方法
10.3.3 邏輯回歸的應(yīng)用優(yōu)勢
10.3.4 邏輯回歸應(yīng)用中的注意事項
10.4 多元線性回歸技術(shù)的實踐應(yīng)用和注意事項
10.4.1 線性回歸的原理和核心要素
10.4.2 線性回歸的應(yīng)用優(yōu)勢
10.4.3 線性回歸應(yīng)用中的注意事項
10.5 模型的過擬合及對策
10.6 一個典型的預(yù)測響應(yīng)模型的案例分享
10.6.1 案例背景
10.6.2 基本的數(shù)據(jù)摸底
10.6.3 建模數(shù)據(jù)的抽取和清洗
10.6.4 初步的相關(guān)性檢驗和共線性排查
10.6.5 潛在自變量的分布轉(zhuǎn)換
10.6.6 自變量的篩選
10.6.7 響應(yīng)模型的搭建與優(yōu)化
10.6.8 冠軍模型的確定和主要的分析結(jié)論
10.6.9 基于模型和分析結(jié)論基礎(chǔ)上的運營方案
10.6.10 模型落地應(yīng)用效果跟蹤反饋
第11章 用戶特征分析的典型應(yīng)用和技術(shù)小竅門
11.1 用戶特征分析所適用的典型業(yè)務(wù)場景
11.1.1 尋找目標(biāo)用戶
11.1.2 尋找運營的抓手
11.1.3 用戶群體細(xì)分的依據(jù)
11.1.4 新品開發(fā)的線索和依據(jù)
11.2 用戶特征分析的典型分析思路和分析技術(shù)
11.2.1 3種劃分的區(qū)別
11.2.2 RFM
11.2.3 聚類技術(shù)的應(yīng)用
11.2.4 決策樹技術(shù)的應(yīng)用
11.2.5 預(yù)測(響應(yīng))模型中的核心自變量
11.2.6 假設(shè)檢驗的應(yīng)用
11.3 特征提煉后的評價體系
11.4 用戶特征分析與用戶預(yù)測模型的區(qū)別和聯(lián)系
11.5 用戶特征分析案例
第12章 運營效果分析的典型應(yīng)用和技術(shù)小竅門
12.1 為什么要做運營效果分析
12.2 統(tǒng)計技術(shù)在數(shù)據(jù)化運營中最重要最常見的應(yīng)用
12.2.1 為什么要進(jìn)行假設(shè)檢驗
12.2.2 假設(shè)檢驗的基本思想
12.2.3 T檢驗概述
12.2.4 兩組獨立樣本T檢驗的假設(shè)和檢驗
12.2.5 兩組獨立樣本的非參數(shù)檢驗
12.2.6 配對差值的T檢驗
12.2.7 配對差值的非參數(shù)檢驗
12.2.8 方差分析概述
12.2.9 單因素方差分析
12.2.10 多個樣本組的非參數(shù)檢驗
12.2.11 卡方檢驗
12.2.12 控制變量的方法
12.2.13 AB Test
第13章 漏斗模型和路徑分析
13.1 網(wǎng)絡(luò)日志和布點
13.1.1 日志布點
13.1.2 日志采集
13.1.3 日志解析
13.1.4 日志分析
13.2 漏斗模型與路徑分析的主要區(qū)別和聯(lián)系
13.3 漏斗模型的主要應(yīng)用場景
13.3.1 運營過程的監(jiān)控和運營效率的分析與改善
13.3.2 用戶關(guān)鍵路徑分析
13.3.3 產(chǎn)品優(yōu)化
13.4 路徑分析的主要應(yīng)用場景
13.5 路徑分析的主要算法
13.5.1 社會網(wǎng)絡(luò)分析方法
13.5.2 基于序列的關(guān)聯(lián)分析
13.5.3 最樸素的遍歷方法
13.6 路徑分析案例的分享
13.6.1 案例背景
13.6.2 主要的分析技術(shù)介紹
13.6.3 分析所用的數(shù)據(jù)概況
13.6.4 主要的數(shù)據(jù)結(jié)論和業(yè)務(wù)解說
13.6.5 主要分析結(jié)論的落地應(yīng)用跟蹤
第14章 數(shù)據(jù)分析師對業(yè)務(wù)團隊數(shù)據(jù)分析能力的培養(yǎng)
14.1 培養(yǎng)業(yè)務(wù)團隊數(shù)據(jù)分析意識與能力的重要性
14.2 數(shù)據(jù)分析師在業(yè)務(wù)團隊數(shù)據(jù)分析意識能力培養(yǎng)中的作用
14.3 數(shù)據(jù)分析師如何培養(yǎng)業(yè)務(wù)團隊的數(shù)據(jù)分析意識和能力
14.4 數(shù)據(jù)分析師培養(yǎng)業(yè)務(wù)團隊數(shù)據(jù)分析意識能力的案例分享
14.4.1 案例背景
14.4.2 過程描述
14.4.3 本項目的效果跟蹤
第15章 換位思考
15.1 為什么要換位思考
15.2 從業(yè)務(wù)方的角度換位思考數(shù)據(jù)分析與挖掘
15.3 從同行的角度換位思考數(shù)據(jù)分析挖掘的經(jīng)驗教訓(xùn)
第16章 養(yǎng)成數(shù)據(jù)分析師的品質(zhì)和思維模式
16.1 態(tài)度決定一切
16.1.1 信念
16.1.2 信心
16.1.3 熱情
16.1.4 敬畏
16.1.5 感恩
16.2 商業(yè)意識是核心
16.2.1 為什么商業(yè)意識是核心
16.2.2 如何培養(yǎng)商業(yè)意識
16.3 一個基本的方法論
16.4 大膽假設(shè),小心求證
16.5 20/80原理
16.6 結(jié)構(gòu)化思維
16.7 優(yōu)秀的數(shù)據(jù)分析師既要客觀,又要主觀
第17章 條條大道通羅馬
17.1 為什么會條條大道通羅馬
17.2 條條大道有側(cè)重
17.3 自覺服從和積極響應(yīng)
17.3.1 自覺服從
17.3.2 積極響應(yīng)
17.4 具體示例
第18章 數(shù)據(jù)挖掘?qū)嵺`的質(zhì)量保障流程和制度
18.1 一個有效的質(zhì)量保障流程制度
18.1.1 業(yè)務(wù)需求的收集
18.1.2 評估小組評估需求的優(yōu)先級
18.1.3 課題組的成立及前期摸底
18.1.4 向業(yè)務(wù)方提交正式課題(項目)計劃書
18.1.5 數(shù)據(jù)分析挖掘的課題展開
18.1.6 向業(yè)務(wù)方提交結(jié)論報告及業(yè)務(wù)落地應(yīng)用建議
18.1.7 課題(項目)的落地應(yīng)用和效果監(jiān)控反饋
18.2 質(zhì)量保障流程制度的重要性
18.3 如何支持與強化質(zhì)量保障流程制度
第19章 幾個經(jīng)典的數(shù)據(jù)挖掘方法論
19.1 SEMMA方法論
19.1.1 數(shù)據(jù)取樣
19.1.2 數(shù)據(jù)探索
19.1.3 數(shù)據(jù)調(diào)整
19.1.4 模式化
19.1.5 評價
19.2 CRISP-DM方法論
19.2.1 業(yè)務(wù)理解
19.2.2 數(shù)據(jù)理解
19.2.3 數(shù)據(jù)準(zhǔn)備
19.2.4 模型搭建
19.2.5 模型評估
19.2.6 模型發(fā)布
19.3 Tom Khabaza的挖掘9律