《大數(shù)據(jù)分析》旨在為組織采用大數(shù)據(jù)技術提供一系列實施策略,建立一個堅實的基礎,即,總體上把握大數(shù)據(jù)能是什么,為什么大數(shù)據(jù)能增值,哪種類型的問題適合用大數(shù)據(jù)方法,以及如何合理規(guī)劃去確定需求,如何在機構中安排合適的人力,如何進行系統(tǒng)集成策劃。
另一方面,《大數(shù)據(jù)分析》不是介紹如何做大數(shù)據(jù)應用開發(fā)的,如MapReduce編程、Hadoop實現(xiàn)等,但各章都會提供一個概述,來說明采用大數(shù)據(jù)的生態(tài)系統(tǒng)相關內容或采用大數(shù)據(jù)的過程。
導語
在技術方面,似乎是“風水輪流轉”,至少以我的經驗看來,它確實是這樣。最近,“大數(shù)據(jù)”和“大數(shù)據(jù)分析”的概念已經變得無處不在——據(jù)說要訪問一個Web站點,打開一份報紙,或閱讀一本雜志,都會提及一個或兩個諸如此類的短語。然而大數(shù)據(jù)所包含的大規(guī)模并行處理、海量數(shù)據(jù)存儲、數(shù)據(jù)分布、高速網絡、高性能計算、任務和線程管理以及數(shù)據(jù)挖掘和分析等都不是新的技術。
我的職業(yè)生涯的第一階段是在20世紀80年代末和90年代初,那時我作為軟件開發(fā)人員,為某公司超級計算機做編程語言編譯器。大多數(shù)這樣的高端系統(tǒng)是多處理器系統(tǒng),采用大規(guī)模并行處理,由大數(shù)據(jù)集(按那時的標準)驅動。我的具體職責是查看代碼優(yōu)化,工作重點是提升處理器的數(shù)據(jù)帶寬和充分利用系統(tǒng)中設計和安裝的多級內存。有趣的是,大部分用于硬件設計和軟件開發(fā)的架構和技術都不是新的,多來自早期的超級計算機的貢獻,如在20世紀70年代初開發(fā)的第一個大規(guī)模并行計算系統(tǒng)IlliacIV。
這就是大數(shù)據(jù)現(xiàn)象讓我如此著迷的原因:不是新技術的出現(xiàn),而是已知的技術最終如何成為主流。當20年前的前沿技術,其技術細節(jié)定期地出現(xiàn)在《紐約時報》《華爾街日報》和《經濟學人》雜志上時,你就會知道它終于到來了。采用新技術面臨的挑戰(zhàn)
很多人對新技術有天然的喜好——總有一種直覺就是最新最閃亮的“銀彈”不僅會解決組織中存在的所有問題,而且還能成為完善整個組織的一條金幣鑄造流。同時,在那些不適應新技術變革的組織中,有被拋棄的揮之不去的恐懼——即使起初新技術沒有明確的價值取向,如果他們不采用,將會遠遠落在后面。
第1章 大數(shù)據(jù)分析的市場和業(yè)務驅動力
1.1 區(qū)分大數(shù)據(jù)的炒作和現(xiàn)實
1.2 理解業(yè)務驅動因素
1.3 降低準入門檻
1.4 注意事項
1.5 思考練習
第2章 適用大數(shù)據(jù)分析的業(yè)務問題
2.1 反對炒作:組織適應能力
2.2 大數(shù)據(jù)價值帶來的提升
2.3 大數(shù)據(jù)用例
2.4 大數(shù)據(jù)應用的特點
2.5 大數(shù)據(jù)價值的感知和量化
2.6 關于價值的進一步思考
2.7 思考練習
第3章 實現(xiàn)大數(shù)據(jù)分析的組織合作
3.1 兩個關鍵問題
3.2 大數(shù)據(jù)分析和報告的歷史視角
3.3 文化沖突的挑戰(zhàn)
3.4 采用大數(shù)據(jù)技術的考慮因素
3.5 合適的決策人
3.6 組織協(xié)調的角色
3.7 思考練習
第4章 制定企業(yè)集成大數(shù)據(jù)分析的戰(zhàn)略
4.1 決定采用大數(shù)據(jù)技術的內容、方式和時機
4.2 采用大數(shù)據(jù)技術的戰(zhàn)略規(guī)劃
4.3 規(guī)范征求業(yè)務用戶需求的做法
4.4 采用新技術的可接受性:明確用或不用的原則
4.5 為可擴展性準備數(shù)據(jù)環(huán)境
4.6 促進數(shù)據(jù)重用
4.7 建立適當?shù)谋O(jiān)督和管理
4.8 為主流技術提供管理過程
4.9 企業(yè)集成的考慮事項
4.10 思考練習
第5章 大數(shù)據(jù)分析的數(shù)據(jù)治理策略與過程
5.1 數(shù)據(jù)治理的演變
5.2 大數(shù)據(jù)和數(shù)據(jù)治理
5.3 與大數(shù)據(jù)集的區(qū)別
5.4 大數(shù)據(jù)監(jiān)管的5個關鍵理念
5.4.1 管理使用者數(shù)據(jù)預期
5.4.2 確定數(shù)據(jù)質量的關鍵維度
5.4.3 實體提取的元數(shù)據(jù)和參考數(shù)據(jù)的一致性
5.4.4 重新調整用途和重新解釋
5.4.5 數(shù)據(jù)充實和強化
5.5 考慮事項
5.6 思考練習
……
第6章 大數(shù)據(jù)管理的高性能設備
第7章 大數(shù)據(jù)工具和技術
第8章 大數(shù)據(jù)應用開發(fā)
第9章 大數(shù)據(jù)的NoSQL數(shù)據(jù)管理
第10章 大數(shù)據(jù)圖分析
第11章 開發(fā)大數(shù)據(jù)路線圖