數(shù)據(jù)挖掘與知識發(fā)現(xiàn)
定 價:32 元
- 作者:李雄飛,董元方,李軍等編著
- 出版時間:2010/7/1
- ISBN:9787040304787
- 出 版 社:高等教育出版社
- 中圖法分類:TP311.13
- 頁碼:303
- 紙張:膠版紙
- 版次:2
- 開本:16K
數(shù)據(jù)挖掘與知識發(fā)現(xiàn)領(lǐng)域中的一些基本理論、研究方法和技術(shù)標(biāo)準(zhǔn),簡單介紹了相關(guān)產(chǎn)品和工具,討論了KDD與數(shù)據(jù)挖掘的概念、數(shù)據(jù)挖掘?qū)ο、知識發(fā)現(xiàn)過程、研究方法以及相關(guān)的研究領(lǐng)域和應(yīng)用范圍。第2章~第9章詳細(xì)地介紹了關(guān)聯(lián)規(guī)則、聚類分析、決策樹、貝葉斯網(wǎng)絡(luò)、人工神經(jīng)網(wǎng)絡(luò)、支持向量機、粗糙集、模糊集等數(shù)據(jù)挖掘模型與算法。第10章討論了模型選擇與模型評估方法。第11章和第12章簡單介紹了數(shù)據(jù)預(yù)處理方法和數(shù)據(jù)挖掘技術(shù)標(biāo)準(zhǔn)、數(shù)據(jù)挖掘可視化技術(shù)和數(shù)據(jù)挖掘工具開發(fā)方法,并簡單介紹了數(shù)據(jù)挖掘產(chǎn)品和工具。 《數(shù)據(jù)挖掘與知識發(fā)現(xiàn)(第2版)》可以作為計算機專業(yè)、信息類專業(yè)、管理類專業(yè)高年級本科生及研究生的教材或參考書,也可供有關(guān)人員學(xué)習(xí)參考。
第1章 緒論
1.1 引言
1.2 KDD與數(shù)據(jù)挖掘
1.2.1 KDD定義
1.2.2 KDD過程
1.2.3 數(shù)據(jù)庫技術(shù)發(fā)展與數(shù)據(jù)挖掘
1.3 數(shù)據(jù)挖掘的對象與環(huán)境
1.3.1 數(shù)據(jù)與系統(tǒng)特征
1.3.2 數(shù)據(jù)結(jié)構(gòu)
1.3.3 數(shù)據(jù)庫系統(tǒng)
1.4 數(shù)據(jù)挖掘方法與相關(guān)領(lǐng)域
1.4.1 數(shù)據(jù)挖掘相關(guān)領(lǐng)域
1.4.2 粗糙集
1.4.3 聚類
1.4.4 關(guān)聯(lián)規(guī)則
1.4.5 決策樹
1.4.6 模糊集
1.4.7 規(guī)則歸納
1.4.8 進(jìn)化計算
1.5 KDD系統(tǒng)與應(yīng)用
本章小結(jié)
習(xí)題1
第2章 關(guān)聯(lián)規(guī)則
2.1 引言
2.2 關(guān)聯(lián)規(guī)則基本模型
2.2.1 關(guān)聯(lián)規(guī)則基本模型
2.2.2 Apriori算法
2.2.3 LIG算法
2.2.4 FP算法
2.3 多級關(guān)聯(lián)規(guī)則與多維關(guān)聯(lián)規(guī)則
2.3.1 多級關(guān)聯(lián)規(guī)則
2.3.2 多維關(guān)聯(lián)規(guī)則
2.4 關(guān)聯(lián)規(guī)則價值衡量與發(fā)展
2.4.1 規(guī)則價值衡量
2.4.2 基于約束的關(guān)聯(lián)規(guī)則
2.4.3 關(guān)聯(lián)規(guī)則新進(jìn)展
本章小結(jié)
習(xí)題2
第3章 聚類分析
3.1 聚類分析簡介
3.2 聚類分析中的數(shù)據(jù)類型
3.3 劃分方法
3.3.1 加均值算法
3.3.2 k-中心點算法
3.3.3 EM算法
3.4 層次方法
3.4.1 凝聚的和分裂的層次聚類
3.4.2 利用層次方法進(jìn)行平衡迭代歸約和聚類
3.4.3 利用代表點聚類
3.4.4 采用動態(tài)建模技術(shù)的層次聚類算法
3.5 基于密度的方法
3.6 基于網(wǎng)格的方法
3.7 基于模型的聚類方法
3.8 孤立點分析
本章小結(jié)
習(xí)題3
第4章 決策樹
4.1 引言
4.2 信息論
4.2.1 信息傳輸與數(shù)據(jù)挖掘
4.2.2 信息論主要概念
4.3 ID3算法
4.4 決策樹的剪枝
4.4.1 預(yù)剪枝
4.4.2 后剪枝
4.4.3 決策樹的性能評價
4.5 決策樹算法的改進(jìn)
4.5.1 二叉樹決策算法
4.5.2 按增益比率估值的方法
4.5.3 按分類信息估值的方法
4.5.4 按劃分距離估值的方法
4.6 C4.5 算法
4.7 CART算法
4.8 SLIQ算法
4.9 決策樹與數(shù)據(jù)預(yù)處理
4.9.1 數(shù)據(jù)概化與約簡
4.9.2 抽樣方法
4.9.3 維歸約及特征子集的選取
4.9.4 冗余特征子集刪除
4.9.5 離散化處理
4.9.6 改變數(shù)據(jù)結(jié)構(gòu)
4.10 算法改進(jìn)
4.10.1 多決策樹綜合技術(shù)
4.10.2 決策樹的增量學(xué)習(xí)
本章小結(jié)
習(xí)題4
第5章 貝葉斯網(wǎng)絡(luò)
5.1 貝葉斯網(wǎng)絡(luò)基本概念
5.2 不確定性推理與聯(lián)合概率分布
5.3貝葉斯網(wǎng)絡(luò)中的獨立關(guān)系
5.3.1 條件獨立
5.3.2 有向分離和條件獨立
5.3.3 因果影響?yīng)毩?/span>
5.3.4 環(huán)境獨立
5.4 貝葉斯網(wǎng)絡(luò)學(xué)習(xí)
5.4.1 結(jié)構(gòu)學(xué)習(xí)
5.4.2 搜索算法
5.4.3 基于約束的方法
5.4.4 參數(shù)學(xué)習(xí)
5.5 貝葉斯網(wǎng)絡(luò)分類器
5.5.1 樸素貝葉斯網(wǎng)絡(luò)分類器
5.5.2 半樸素貝葉斯分類器與選擇貝葉斯分類器
5.5.3 樹增廣樸素貝葉斯網(wǎng)絡(luò)分類器
5.5.4 廣義樸素貝葉斯網(wǎng)絡(luò)分類器
本章小結(jié)
習(xí)題5
第6章 人工神經(jīng)網(wǎng)絡(luò)
6.1 人工神經(jīng)元及人工神經(jīng)網(wǎng)絡(luò)模型
6.1.1 M.P模型
6.1.2 人工神經(jīng)元的形式化描述
6.1.3 神經(jīng)網(wǎng)絡(luò)的分類
6.1.4 人工神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方式
6.2 前向神經(jīng)網(wǎng)絡(luò)
6.2.1 感知器
6.2.2 多層前向神經(jīng)網(wǎng)絡(luò)的BP算法
6.2.3 徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)
6.3 反饋神經(jīng)網(wǎng)絡(luò)
6.3.1 前向神經(jīng)網(wǎng)絡(luò)與反饋神經(jīng)網(wǎng)絡(luò)的比較
6.3.2 反饋神經(jīng)網(wǎng)絡(luò)模型
6.3.3 離散型Hopfield神經(jīng)網(wǎng)絡(luò)
6.3.4 連續(xù)型Hopfield神經(jīng)網(wǎng)絡(luò)
6.3.5 Boltzmarm機
6.4 自組織競爭神經(jīng)網(wǎng)絡(luò)模型
6.5 基于人工神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘
本章小結(jié)
習(xí)題6
第7章 支持向量機
7.1 學(xué)習(xí)機器泛化性能的界
7.1.1 VC維
7.1.2 Rn中有向超平面對點的打散
7.1.3 VC維和參數(shù)個數(shù)
7.1.4 通過最小化h最小化界
7.1.5 實例
7.1.6 結(jié)構(gòu)風(fēng)險最小化
7.2 線性支持向量機
7.2.1 可分情形
7.2.2 Karush-Kuim-TUckei·條件
7.2.3 測試
7.2.4 非可分情形
7.3 非線性支持向量機
7.3.1 硬間隔非線性支持向量機
7.3.2 軟間隔非線性支持向量機
7.3.3 v-SVM分類器
7.3.4 處理不平衡數(shù)據(jù)的加權(quán)SVM
7.3.5 多類別SVM分類
7.3.6 Mercer。條件及Mercer定理
7.3.7 非線性支持向量機實例
7.4 支持向量機的VC維
7.5 支持向量機應(yīng)用
7.5.1 手寫體數(shù)字識別
7.5.2 文本分類
7.5.3 生物信息學(xué)中的SVM應(yīng)用
本章小結(jié)
習(xí)題7
第8章 粗糙集
8.1 近似空間
8.1.1 近似空間與不可分辨關(guān)系
8.1.2 知識與知識庫
8.2 近似與粗糙集
8.2.1 近似與粗糙集的基本概念
8.2.2 粗糙集的基本性質(zhì)
8.3 粗糙集的特征描述
8.3.1 近似精度
8.3.2 粗糙集隸屬函數(shù)
8.3.3 拓?fù)涮卣?/span>
8.4 知識約簡
8.4.1 約簡與核
8.4.2 相對約簡和相對核
8.5 知識的依賴性
8.6 信息系統(tǒng)
8.6.1 信息系統(tǒng)的定義
8.6.2 分辨矩陣與分辨函數(shù)
8.7 決策表
8.8 決策規(guī)則
8.9 擴(kuò)展的粗糙集模型
8.9.1 可變精度粗糙集模型
8.9.2 相似模型
本章小結(jié)
習(xí)題8
第9章 模糊集
9.1 模糊集定義與隸屬函數(shù)
9.1.1 模糊集定義與隸屬函數(shù)
9.1.2 模糊集合的表示法
9.2 模糊集的基本運算
9.3 分解定理與擴(kuò)展原理
9.4 模糊集的特征
9.5 模糊集的度量
9.5.1 模糊度
9.5.2 模糊集間的距離
9.5.3 模糊集的貼近度
9.6 模糊關(guān)系
9.6.1 模糊關(guān)系定義
9.6.2 模糊關(guān)系的運算與性質(zhì)
9.6.3 模糊等價關(guān)系與模糊相似關(guān)系
9.7 模糊聚類分析
9.7.1 模糊劃分
9.7.2 模糊相似系數(shù)的標(biāo)定方法
9.7.3 模糊聚類分析
9.7.4 傳遞閉包法
9.7.5 最大樹法
9.7.6 模糊c-均值聚類
9.8 模糊集與粗糙集
本章小節(jié)
習(xí)題9
第10章 模型選擇與模型評估
10.1 模型的過擬合
10.2 沒有天生優(yōu)越的分類器
10.3 模型、模型選擇和模型評估
10.4 簡單劃分和交叉驗證
10.5 自助法
10.6 Occam剃刀
10.7 最小描述長度準(zhǔn)則
10.8 信息準(zhǔn)則
10.8.1 Akaike信息準(zhǔn)則
10.8.2 Bayesian信息準(zhǔn)則
10.9 比較分類器的方法
10.9.1 估計準(zhǔn)確率的置信區(qū)間
10.9.2 比較兩個模型的性能
10.9.3 比較兩種分類法的性能
10.1 0聚類評估
10.1 0.1 假設(shè)檢驗
10.1 0.2 聚類評估中的假設(shè)檢驗
10.1 0.3 相對準(zhǔn)則
本章小結(jié)
習(xí)題10
第11章 數(shù)據(jù)預(yù)處理與可視化技術(shù)
11.1 數(shù)據(jù)清理
11.1.1 填補空缺值
11.1.2 消除噪聲數(shù)據(jù)
11.1.3 實現(xiàn)數(shù)據(jù)一致性
11.2 數(shù)據(jù)集成與轉(zhuǎn)換
11.2.1 數(shù)據(jù)集成
11.2.2 數(shù)據(jù)轉(zhuǎn)換
11.3 數(shù)據(jù)歸約與濃縮
11.3.1 數(shù)據(jù)立方體聚集
11.3.2 維歸約
11.3.3 數(shù)據(jù)壓縮
11.3.4 數(shù)值歸約
11.4 概念分層
11.4.1 概念分層的概念
11.4.2 概念分層的類型
11.4.3 數(shù)值數(shù)據(jù)的概念分層與離散化
11.4.4 分類數(shù)據(jù)的概念分層
11.5 可視化技術(shù)概述
11.5.1 可視化技術(shù)分類
11.5.2 可視化技術(shù)在數(shù)據(jù)挖掘中的應(yīng)用
11.6 過程可視化
11.7 數(shù)據(jù)可視化
11.7.1 折線圖
11.7.2 復(fù)合餅圖
11.7.3 散點圖
11.7.4 盒圖
11.7.5 平行坐標(biāo)法
11.7.6 圓環(huán)分段表示
11.8 結(jié)果可視化
11.8.1 關(guān)聯(lián)規(guī)則
11.8.2 分類
11.8.3 聚類
本章小結(jié)
習(xí)題11
第12章 數(shù)據(jù)挖掘工具與產(chǎn)品
12.1 數(shù)據(jù)挖掘標(biāo)準(zhǔn)
12.1.1 數(shù)據(jù)挖掘標(biāo)準(zhǔn)化概述
12.1.2 數(shù)據(jù)挖掘過程標(biāo)準(zhǔn)
12.1.3 數(shù)據(jù)挖掘接口標(biāo)準(zhǔn)
12.1.4 數(shù)據(jù)挖掘的語言標(biāo)準(zhǔn)
12.1.5 數(shù)據(jù)挖掘的Web標(biāo)準(zhǔn)
12.1.6 數(shù)據(jù)挖掘標(biāo)準(zhǔn)的應(yīng)用與未來發(fā)展趨勢
12.2 數(shù)據(jù)挖掘工具的介紹
12.2.1 數(shù)據(jù)挖掘工具發(fā)展過程概述
12.2.2 數(shù)據(jù)挖掘工具簡介
12.2.3 WEKA
12.2.4 SPSS
12.3 數(shù)據(jù)挖掘產(chǎn)品分析
12.3.1 通用數(shù)據(jù)挖掘產(chǎn)品
12.3.2 專用挖掘產(chǎn)品
本章小結(jié)
習(xí)題12
附錄中英文術(shù)語對照
參考文獻(xiàn)