處在大數(shù)據時代發(fā)展的重要節(jié)點上,面對數(shù)字化生活的新需求、數(shù)字化轉型的新格局及數(shù)字經濟的新業(yè)態(tài),商務智能正在扮演著越來越重要的角色。商務智能通過數(shù)據挖掘和機器學習技術從海量多模態(tài)數(shù)據中發(fā)現(xiàn)潛在、新穎和有用的知識,以支持管理與決策。它是內在技術的,同時也是面向管理決策問題的。本書旨在把握前沿趨勢,以基礎篇、方法篇、專題篇三大板塊的形式,為讀者提供一個技術與管理的融合視角,介紹和闡釋商務智能領域的主要知識內涵,包括面向管理決策的商務智能基本原理、主流方法、應用情境和發(fā)展前景,幫助讀者理解如何通過商務智能進行大數(shù)據/人工智能分析和賦能,從而提升組織和個體的核心能力及其競爭優(yōu)勢。
陳國青,清華大學經濟管理學院教授。國家自然科學基金委大數(shù)據重大研究計劃指導專家組組長,教育部高等學校管理科學與工程類專業(yè)教學指導委員會主任,國家信息化專家咨詢委員會成員,教育部新文科建設工作組成員。曾任國際模糊系統(tǒng)學會(IFSA)副主席,CNAIS創(chuàng)始主席,國際管理商學院聯(lián)盟(PIM)聯(lián)執(zhí)主席。曾多年擔任清華大學經濟管理學院常務副院長、學術委員會主任、講席教授。擔任/曾任中國信息經濟學會等多個國內一級學會副理事長。曾主持國家自然科學基金委重大項目等多個國家級科研項目,以及多個國際合作項目、企業(yè)信息戰(zhàn)略管理項目等。
目 錄
基 礎 篇
第1章 引言 003
1.1 商務智能簡介 004
1.2 商務智能與信息社會 007
1.2.1 信息技術提升信息社會發(fā)展水平 007
1.2.2 商務智能是信息社會的產物 010
1.2.3 商務智能是信息社會繁榮的推動力 011
1.3 商務智能與企業(yè)管理 013
1.3.1 商務智能在企業(yè)管理中的作用 013
1.3.2 商務智能協(xié)助企業(yè)管理的方式 014
1.3.3 商務智能的商業(yè)價值 015
1.4 商務智能的方法 016
1.5 商務智能的數(shù)據 019
小結 020
思考與練習 021
第2章 商務智能應用 022
2.1 制造領域應用 023
2.2 金融領域應用 026
2.3 通信領域應用 029
2.4 生物和醫(yī)藥領域應用 031
2.5 零售和營銷領域應用 033
2.6 移動商務應用 036
2.7 社會化商務應用 037
小結 039
思考與練習 040
第3章 商務智能過程 041
3.1 數(shù)據庫與事務處理 043
3.1.1 數(shù)據庫與數(shù)據庫管理系統(tǒng) 043
3.1.2 在線事務處理 044
3.2 數(shù)據倉庫與在線分析處理 045
3.2.1 從事務處理到分析處理 045
3.2.2 數(shù)據倉庫 047
3.3 企業(yè)知識發(fā)現(xiàn) 050
3.3.1 OLAP與知識發(fā)現(xiàn) 051
3.3.2 企業(yè)內部知識發(fā)現(xiàn) 052
3.3.3 企業(yè)外部知識發(fā)現(xiàn) 052
小結 054
思考與練習 054
第4章 數(shù)據平臺 055
4.1 數(shù)據處理技術演進 056
4.2 數(shù)據倉庫過程與體系結構 058
4.3 數(shù)據集成、提取與轉換 060
4.3.1 數(shù)據提取 060
4.3.2 數(shù)據轉換 062
4.3.3 數(shù)據加載 063
4.3.4 ETL設計與開發(fā) 063
4.4 數(shù)據倉庫開發(fā)、管理與安全 064
4.4.1 數(shù)據倉庫開發(fā)模式 064
4.4.2 數(shù)據倉庫設計 066
4.4.3 數(shù)據倉庫的邏輯數(shù)據模型 068
4.4.4 元數(shù)據 070
4.4.5 數(shù)據倉庫的安全 072
4.5 分布式數(shù)據平臺 074
4.5.1 分布式數(shù)據平臺概念 074
4.5.2 分布式數(shù)據平臺與功能組件 075
4.6 云數(shù)據平臺 078
4.6.1 云數(shù)據平臺概念 078
4.6.2 云數(shù)據平臺與商務智能 079
小結 081
思考與練習 081
第5章 構建商務智能環(huán)境 083
5.1 商務智能環(huán)境 084
5.1.1 確定數(shù)據可用的能力 084
5.1.2 數(shù)據挖掘的能力 085
5.1.3 用戶與系統(tǒng)交互的能力 085
5.2 商務智能組織 086
5.2.1 外包商務智能 088
5.2.2 內給商務智能 089
5.2.3 商務智能組織成員 090
5.3 商務智能系統(tǒng) 090
5.3.1 商務智能基礎設施 090
5.3.2 商務智能系統(tǒng)軟件 091
5.3.3 商務智能系統(tǒng)產品 094
小結 096
思考與練習 096
方 法 篇
第6章 數(shù)據預處理 099
6.1 數(shù)據預處理簡介 100
6.1.1 數(shù)據預處理的原因 100
6.1.2 數(shù)據預處理的目的 102
6.1.3 數(shù)據預處理的方法 102
6.2 數(shù)據清洗 103
6.2.1 缺失數(shù)據處理 103
6.2.2 噪聲數(shù)據處理 105
6.3 數(shù)據集成、規(guī)范與歸納 107
6.3.1 數(shù)據集成處理 107
6.3.2 數(shù)據規(guī)范化處理 108
6.3.3 數(shù)據歸納處理 110
6.4 數(shù)據消減 115
6.4.1 數(shù)據冗余清除 115
6.4.2 數(shù)據采樣 116
6.4.3 數(shù)據立方合計 117
6.4.4 數(shù)據屬性選取與生成 118
6.4.5 數(shù)據壓縮 120
6.4.6 數(shù)據離散化與概念分層 121
小結 124
思考與練習 125
第7章 關聯(lián)規(guī)則 126
7.1 關聯(lián)規(guī)則簡介 127
7.2 關聯(lián)規(guī)則挖掘方法 130
7.3 關聯(lián)規(guī)則興趣性 133
7.4 關聯(lián)規(guī)則知識形式擴展 136
7.4.1 廣義關聯(lián)規(guī)則 136
7.4.2 數(shù)量關聯(lián)規(guī)則 138
7.4.3 時態(tài)關聯(lián)規(guī)則 139
7.5 簡單關聯(lián)規(guī)則 140
小結 143
思考與練習 144
第8章 分類分析 145
8.1 分類分析簡介 146
8.2 決策樹分類 147
8.2.1 決策樹構建 148
8.2.2 決策樹剪枝 151
8.3 貝葉斯分類 153
8.3.1 貝葉斯定理 153
8.3.2 簡單貝葉斯分類器 153
8.3.3 貝葉斯信念網絡 155
8.4 其他分類方法 157
8.4.1 神經元網絡分類 157
8.4.2 支持向量機分類 157
8.4.3 懶惰型分類器 158
8.5 分類準確率 159
8.5.1 分類準確率比較與評估 159
8.5.2 提高分類器的準確率 164
小結 165
思考與練習 165
第9章 聚類分析 167
9.1 聚類分析簡介 168
9.2 相似度與距離測度 169
9.3 聚類分析方法 172
9.3.1 劃分方法 172
9.3.2 層次方法 173
9.3.3 基于密度的方法 175
9.3.4 基于網格的方法 175
9.3.5 基于模型的方法 176
9.4 k-means方法 176
9.5 DBSCAN方法 179
小結 184
思考與練習 185
第10章 社會網絡分析 186
10.1 社會網絡的中心性 187
10.1.1 度中心性 188
10.1.2 貼近中心性 188
10.1.3 中介中心性 189
10.2 社會網絡的權威 190
10.2.1 度權威 190
10.2.2 鄰近權威 191
10.2.3 等級權威 192
10.3 引用社會網絡 192
10.3.1 同引分析 192
10.3.2 引文耦合 193
10.4 社會網絡的鏈接分析 193
10.4.1 PageRank算法 194
10.4.2 HITS算法 196
10.5 社會網絡中的社區(qū) 198
小結 199
思考與練習 200
第11章 概率圖模型 201
11.1 概率圖模型簡介 202
11.2 樸素貝葉斯模型 203
11.3 隱馬爾可夫模型 205
11.3.1 馬爾可夫過程 205
11.3.2 隱馬爾可夫建模與處理 206
11.4 高斯混合模型 209
11.5 LDA模型 211
小結 214
思考與練習 215
第12章 神經元網絡 216
12.1 神經元網絡簡介 217
12.2 前饋神經元網絡 218
12.2.1 神經元 218
12.2.2 激活函數(shù) 218
12.2.3 前饋神經元網絡 220
12.3 卷積神經元網絡 222
12.3.1 卷積層 222
12.3.2 匯聚層 224
12.3.3 卷積神經元網絡結構 225
12.3.4 典型卷積神經元網絡 225
12.4 循環(huán)神經元網絡 226
12.4.1 循環(huán)神經元網絡基礎結構 227
12.4.2 長/短期記憶網絡 228
12.4.3 門控循環(huán)單元網絡 230
12.5 注意力機制 231
12.5.1 多頭注意力模型 232
12.5.2 自注意力模型 232
小結 234
思考與練習 234
第13章 多模態(tài)數(shù)據表征 236
13.1 文本表征 237
13.1.1 詞袋模型 237
13.1.2 Word2vec模型 239
13.1.3 Doc2vec模型 240
13.1.4 主題模型 241
13.2 圖像表征 243
13.3 音頻表征 244
13.4 視頻表征 247
小結 248
思考與練習 248
專 題 篇
第14章 信息提取與洞察 251
14.1 “大數(shù)據—小數(shù)據”問題概述 252
14.2 代表性信息提取 254
14.2.1 代表性評估測度 254
14.2.2 代表性信息提取方法 255
14.3 一致性信息提取 257
14.3.1 一致性評估測度 258
14.3.2 一致性信息提取方法 259
14.4 多樣性信息提取 260
14.4.1 多樣性評估測度 261
14.4.2 多樣性信息提取方法 262
小結 263
思考與練習 264
第15章 關聯(lián)分類 265
15.1 生成分類關聯(lián)規(guī)則 266
15.2 分類關聯(lián)規(guī)則剪枝 269
15.2.1 后剪枝方式 269
15.2.2 先剪枝方式 272
15.3 構建分類器 275
15.3.1 單一規(guī)則分類器 275
15.3.2 多規(guī)則分類器 277
15.4 混合型關聯(lián)分類 278
15.5 GARC方法解析 278
15.5.1 GARC思路與算法框架 279
15.5.2 數(shù)據實驗與方法比較 282
小結 285
思考與練習 286
第16章 不確定性知識發(fā)現(xiàn) 288
16.1 不確定性信息表達 289
16.2 分區(qū)中的邊界問題 296
16.3 數(shù)據間的部分隸屬性 300
16.4 不完整數(shù)據依賴 303
小結 307
思考與練習 307
第17章 智能推薦 309
17.1 信息推薦方法 310
17.1.1 推薦系統(tǒng)概述 310
17.1.2 協(xié)同過濾推薦方法 312
17.1.3 推薦系統(tǒng)評測指標 314
17.1.4 消費者信息搜索過程中的推薦 316
17.2 多模態(tài)信息推薦 319
17.2.1 多模態(tài)信息表征 320
17.2.2 多視圖信息整合 322
17.2.3 商品推薦場景 322
17.3 序列推薦 323
17.4 捆綁推薦 325
小結 328
思考與練習 328
第18章 商務智能的經濟社會影響與發(fā)展 329
18.1 商務智能與管理決策 330
18.2 商務智能的發(fā)展趨勢 332
18.2.1 移動商務智能 332
18.2.2 人工智能賦能 333
18.2.3 數(shù)據安全與隱私保護 334
18.2.4 數(shù)據治理 336
小結 337
思考與練習 338
參考文獻 339
索引詞檢索目錄 362