《大數據分析》旨在為組織采用大數據技術提供一系列實施策略,建立一個堅實的基礎,即,總體上把握大數據能是什么,為什么大數據能增值,哪種類型的問題適合用大數據方法,以及如何合理規(guī)劃去確定需求,如何在機構中安排合適的人力,如何進行系統(tǒng)集成策劃。
另一方面,《大數據分析》不是介紹如何做大數據應用開發(fā)的,如MapReduce編程、Hadoop實現等,但各章都會提供一個概述,來說明采用大數據的生態(tài)系統(tǒng)相關內容或采用大數據的過程。
導語
在技術方面,似乎是“風水輪流轉”,至少以我的經驗看來,它確實是這樣。最近,“大數據”和“大數據分析”的概念已經變得無處不在——據說要訪問一個Web站點,打開一份報紙,或閱讀一本雜志,都會提及一個或兩個諸如此類的短語。然而大數據所包含的大規(guī)模并行處理、海量數據存儲、數據分布、高速網絡、高性能計算、任務和線程管理以及數據挖掘和分析等都不是新的技術。
我的職業(yè)生涯的第一階段是在20世紀80年代末和90年代初,那時我作為軟件開發(fā)人員,為某公司超級計算機做編程語言編譯器。大多數這樣的高端系統(tǒng)是多處理器系統(tǒng),采用大規(guī)模并行處理,由大數據集(按那時的標準)驅動。我的具體職責是查看代碼優(yōu)化,工作重點是提升處理器的數據帶寬和充分利用系統(tǒng)中設計和安裝的多級內存。有趣的是,大部分用于硬件設計和軟件開發(fā)的架構和技術都不是新的,多來自早期的超級計算機的貢獻,如在20世紀70年代初開發(fā)的第一個大規(guī)模并行計算系統(tǒng)IlliacIV。
這就是大數據現象讓我如此著迷的原因:不是新技術的出現,而是已知的技術最終如何成為主流。當20年前的前沿技術,其技術細節(jié)定期地出現在《紐約時報》《華爾街日報》和《經濟學人》雜志上時,你就會知道它終于到來了。采用新技術面臨的挑戰(zhàn)
很多人對新技術有天然的喜好——總有一種直覺就是最新最閃亮的“銀彈”不僅會解決組織中存在的所有問題,而且還能成為完善整個組織的一條金幣鑄造流。同時,在那些不適應新技術變革的組織中,有被拋棄的揮之不去的恐懼——即使起初新技術沒有明確的價值取向,如果他們不采用,將會遠遠落在后面。
第1章 大數據分析的市場和業(yè)務驅動力
1.1 區(qū)分大數據的炒作和現實
1.2 理解業(yè)務驅動因素
1.3 降低準入門檻
1.4 注意事項
1.5 思考練習
第2章 適用大數據分析的業(yè)務問題
2.1 反對炒作:組織適應能力
2.2 大數據價值帶來的提升
2.3 大數據用例
2.4 大數據應用的特點
2.5 大數據價值的感知和量化
2.6 關于價值的進一步思考
2.7 思考練習
第3章 實現大數據分析的組織合作
3.1 兩個關鍵問題
3.2 大數據分析和報告的歷史視角
3.3 文化沖突的挑戰(zhàn)
3.4 采用大數據技術的考慮因素
3.5 合適的決策人
3.6 組織協(xié)調的角色
3.7 思考練習
第4章 制定企業(yè)集成大數據分析的戰(zhàn)略
4.1 決定采用大數據技術的內容、方式和時機
4.2 采用大數據技術的戰(zhàn)略規(guī)劃
4.3 規(guī)范征求業(yè)務用戶需求的做法
4.4 采用新技術的可接受性:明確用或不用的原則
4.5 為可擴展性準備數據環(huán)境
4.6 促進數據重用
4.7 建立適當的監(jiān)督和管理
4.8 為主流技術提供管理過程
4.9 企業(yè)集成的考慮事項
4.10 思考練習
第5章 大數據分析的數據治理策略與過程
5.1 數據治理的演變
5.2 大數據和數據治理
5.3 與大數據集的區(qū)別
5.4 大數據監(jiān)管的5個關鍵理念
5.4.1 管理使用者數據預期
5.4.2 確定數據質量的關鍵維度
5.4.3 實體提取的元數據和參考數據的一致性
5.4.4 重新調整用途和重新解釋
5.4.5 數據充實和強化
5.5 考慮事項
5.6 思考練習
……
第6章 大數據管理的高性能設備
第7章 大數據工具和技術
第8章 大數據應用開發(fā)
第9章 大數據的NoSQL數據管理
第10章 大數據圖分析
第11章 開發(fā)大數據路線圖