熊贇、朱揚勇、陳志淵編*的這本《大數(shù)據(jù)挖掘》系統(tǒng)介紹了大數(shù)據(jù)挖掘的概念、原理、技術和應用,具體內(nèi)容包括:認識和理解大數(shù)據(jù);大數(shù)據(jù)挖掘需要的相關技術(大數(shù)據(jù)獲取技術、大數(shù)據(jù)存儲管理技術和大數(shù)據(jù)可視化技術等);大數(shù)據(jù)計算框架;大數(shù)據(jù)挖掘任務(關聯(lián)分析、聚類分析、分類分析、異常分析、特異群組挖掘和演變分析);大數(shù)據(jù)應用實現(xiàn)。
本書對大數(shù)據(jù)挖掘技術進行了全面而細致的定義和歸納,并向讀者展現(xiàn)了該領域*新研究熱點和技術。
本書可供數(shù)據(jù)科學專業(yè)的高等學校學生及教師,從事數(shù)據(jù)領域工作的研究人員、技術人員、管理人員和決策人員參考閱讀。
第1章 緒論
.1.1 理解大數(shù)據(jù)挖掘
1.1.1 大數(shù)據(jù)挖掘的定義
1.1.2 大數(shù)據(jù)挖掘的任務
1.1.3 大數(shù)據(jù)挖掘的特點
1.1.4 大數(shù)據(jù)挖掘與相關技術的差異
.1.2 大數(shù)據(jù)挖掘的相關技術
1.2.1 大數(shù)據(jù)獲取
1.2.2 大數(shù)據(jù)存儲與管理
1.2.3 大數(shù)據(jù)可視化
.1.3 小結
參考文獻
第2章 大數(shù)據(jù)計算框架
.2.1 HDFS
.2.2 MapReduce
2.2.1 MapReduce框架及范例
2.2.2 MapReduce存在的問題和解決方法
.2.3 NoSQL(非關系型)數(shù)據(jù)庫
2.3.1 NoSQL數(shù)據(jù)庫的分類
2.3.2 NoSQL數(shù)據(jù)庫實例
.2.4 SQL(關系型)數(shù)據(jù)庫
2.4.1 Apache HIVE
2.4.2 其他SQL數(shù)據(jù)庫
.2.5 小結
參考文獻
第3章關聯(lián)分析
.3.1 關聯(lián)分析的基本概念
3.1.1 關聯(lián)分析的定義
3.1.2 關聯(lián)規(guī)則的定義
3.1.3 關聯(lián)規(guī)則的分類
.3.2 關聯(lián)規(guī)則挖掘的原理
3.2.1 挖掘簡單關聯(lián)規(guī)則
3.2.2 挖掘量化關聯(lián)規(guī)則
3.2.3 挖掘多層關聯(lián)規(guī)則
3.2.4 挖掘多維關聯(lián)規(guī)則
.3.3 關聯(lián)規(guī)則挖掘的基礎算法
3,3.1 Apriori算法
3.3.2 Apriori算法的優(yōu)化
3.3.3 FP-Growth算法
3.3.4 序列模式挖掘算法
.3.4 挖掘算法的進階方法
3.4.1 USpan:高效用序列模式挖掘算法
3.4.2 HulsMaR:基于MapReduCC的序列模式挖掘算法
.3.5 小結
參考文獻
第4章 聚類分析
.4.1 聚類分析的基本概念
4.1.1 簇與聚類
4.1.2 相似性度量和聚類原理
.4.2 聚類分析的基礎算法
4.1.1 層次的方法——單連接算法、BIRCH算法
4.2.2 劃分的方法——κ-means和κ-medoids算法
4.2.3 基于密度的方法——OPTICS算法
.4.3 聚類分析的進階方法
4.3.1 Density Peaks算法(AA算法)
4.3.2 κ-means:真基于MapReduce的κ-means算法
.4.4 小結
參考文獻
第5章 分類分析
.5.1 分類分析的基本概念
.5.2 分類模型
.5.3 分類分析的原理
5.3.1 決策樹
5.3.2 基于統(tǒng)計的方法
5.3.3 基于神經(jīng)網(wǎng)絡的方法
.5.4 分類分析的基礎算法
5.4.I ID3和C4.5算法:基于決策樹的分類算法
5.4.2 SLIQ:一種高速可伸縮的基于決策樹的分類算法
5.4.3 后向傳播算法BP算法:基于神經(jīng)網(wǎng)絡的分類算法
.5.5 分類分析的進階方法
.5.6 小結
參考文獻
第6章 異常分析
.6.1 異常分析的基本概念
6.1.1 異常
6.1.2 異常分析
.6.2 異常分析的原理
6.2.1 基于統(tǒng)計的異常分析方法
6 2.2 基于偏差的異常分析方法
6.2.3 基于距離的異常分析方法
6.2.4 基于密度的異常分析方法
.6.3 異常分析的主要算法
6.3.1 基于距離的異常分析算法
6.3.2 基于密度的異常分析算法
.6.4 小結
參考文獻
第7章 特異群組挖掘
.7.1 特異群組挖掘的基本概念
.7.2 特異群組挖掘與聚類和異常檢測的關系
.7.3 特異群組挖掘形式化描述
.7.4 特異群組挖掘框架算法
.7.5 特異群組挖掘應用
.7.6 小結
參考文獻
第8章 演變分析
.8.1 演變分析的基本概念
.8.2 演變分析的原理
.8.3 演變分析的基礎算法
.8.4 演變分析的進階算法
8.4.1 時間序列隨機偏移符號化表示算法
8.4.2 多維溫度序列協(xié)同異常事件挖掘算法
.8.5 小結
參考文獻
第9章 異質數(shù)據(jù)網(wǎng)絡挖掘
.9.1 異質數(shù)據(jù)網(wǎng)絡
.9.2 異質數(shù)據(jù)網(wǎng)絡挖掘研究現(xiàn)狀
.9.3 數(shù)據(jù)網(wǎng)絡上的相似性度量的研究
.9.4 異質數(shù)據(jù)網(wǎng)絡挖掘研究內(nèi)容
.9.5 小結
參考文獻
第10章 大數(shù)據(jù)挖掘應用之推薦系統(tǒng)
.1..1 推薦系統(tǒng)研究階段
.1..2 推薦系統(tǒng)算法
10.2.1 推薦系統(tǒng)定義
10.2 推薦算法分類
10.2.3 比較與分析
.10.3 推薦系統(tǒng)的評測
.10.4 小結
參考文獻
第11章 大數(shù)據(jù)中的隱私問題
.11.1 隱私的重要性
.11.2 隱私保護技術
11.2.1 直接攻擊的應對方法
11.2.2 間接攻擊的應對方法
.11.3 小結
參考文獻