數(shù)據(jù)倉庫與數(shù)據(jù)挖掘教程(21世紀高等學校規(guī)劃教材·計算機科學與技術)
定 價:54.9 元
- 作者:黃德才
- 出版時間:2016/7/4
- ISBN:9787302434122
- 出 版 社:清華大學出版社
- 中圖法分類:TP311.13
- 頁碼:405
- 紙張:膠版紙
- 版次:1
- 開本:16K
本書較詳細地介紹了數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的原理、方法及應用技術。全書共有14章,分為4篇。第1章為緒論篇,介紹數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的基本概念及其相互關系;第2~6章為數(shù)據(jù)倉庫原理及應用篇,主要介紹數(shù)據(jù)倉庫的概念模型、邏輯模型和物理模型,以及數(shù)據(jù)倉庫的規(guī)劃、設計、實施和OLAP應用等;第7~10章為傳統(tǒng)數(shù)據(jù)挖掘原理及算法篇,介紹數(shù)據(jù)的屬性類型與相似性度量、關聯(lián)規(guī)則挖掘、分類規(guī)則挖掘、聚類分析和離群點挖掘算法等;第11~14章為數(shù)據(jù)挖掘創(chuàng)新篇,主要內容取自編者近年指導研究生發(fā)表的學術論文,并根據(jù)教學需要進行適當補充修改而成,包括混合屬性數(shù)據(jù)、數(shù)據(jù)流和不確定數(shù)據(jù)的聚類分析,以及量子遺傳聚類算法等。本書可作為普通高等院校計算機專業(yè)與IT相關專業(yè)高年級本科生和研究生的教材,也可作為經濟管理類專業(yè)同名課程的教材和參考書,還可作為電子商務、金融保險等行業(yè)數(shù)據(jù)管理與數(shù)據(jù)分析人員的培訓教材或自學參考書。
兼顧應用型人才與學術型人才的培養(yǎng)需求;
有機融合傳統(tǒng)理論方法與創(chuàng)新思想方法;
理論敘述深入淺出,實際應用具體完整;
算法描述自然易懂,計算實例詳略得當。
第1章緒論
1.1數(shù)據(jù)倉庫概述
1.1.1從傳統(tǒng)數(shù)據(jù)庫到數(shù)據(jù)倉庫
1.1.2數(shù)據(jù)倉庫的4個特征
1.1.3數(shù)據(jù)倉庫系統(tǒng)
1.1.4數(shù)據(jù)倉庫系統(tǒng)體系結構
1.1.5數(shù)據(jù)倉庫數(shù)據(jù)的粒度與組織
1.2數(shù)據(jù)挖掘概述
1.2.1數(shù)據(jù)挖掘產生的背景
1.2.2數(shù)據(jù)挖掘與知識發(fā)現(xiàn)
1.2.3數(shù)據(jù)挖掘的數(shù)據(jù)來源
1.2.4數(shù)據(jù)挖掘的任務
1.2.5數(shù)據(jù)挖掘的步驟
1.2.6數(shù)據(jù)挖掘的應用
1.3數(shù)據(jù)倉庫與數(shù)據(jù)挖掘
1.3.1數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的區(qū)別
1.3.2數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的關系
1.4教程章節(jié)組織與學時建議
習題1
第2章數(shù)據(jù)倉庫原理
2.1多數(shù)據(jù)源問題
2.2數(shù)據(jù)預處理
2.2.1數(shù)據(jù)清洗
2.2.2數(shù)據(jù)變換
2.2.3數(shù)據(jù)歸約
2.3ER模型
2.4數(shù)據(jù)倉庫的概念模型
2.4.1多維數(shù)據(jù)模型
2.4.2維度與粒度
2.5數(shù)據(jù)倉庫的邏輯模型
2.5.1多維數(shù)據(jù)庫系統(tǒng)
2.5.2星形模型
2.5.3雪花模型
2.6數(shù)據(jù)倉庫的物理模型
2.6.1位圖索引模型
2.6.2廣義索引模型
2.6.3連接索引模型
2.6.4RAID存儲結構
習題2
第3章數(shù)據(jù)倉庫的設計開發(fā)應用
3.1數(shù)據(jù)倉庫設計的特點
3.2數(shù)據(jù)倉庫系統(tǒng)開發(fā)過程
3.3數(shù)據(jù)倉庫系統(tǒng)的規(guī)劃
3.4數(shù)據(jù)倉庫的設計
3.4.1需求分析
3.4.2概念設計
3.4.3邏輯設計
3.4.4物理設計
3.5數(shù)據(jù)倉庫的實施
3.5.1數(shù)據(jù)倉庫的創(chuàng)建
3.5.2數(shù)據(jù)的抽取、轉換和加載
3.6數(shù)據(jù)倉庫系統(tǒng)的開發(fā)
3.6.1開發(fā)任務
3.6.2開發(fā)方法
3.6.3系統(tǒng)測試
3.7數(shù)據(jù)倉庫系統(tǒng)的應用
3.7.1用戶培訓
3.7.2決策支持
3.7.3維護評估
習題3
第4章警務數(shù)據(jù)倉庫的實現(xiàn)
4.1SQL Server 2008 R2
4.1.1SQL Server的服務功能
4.1.2SQL Server Management Studio
4.1.3Microsoft Visual Studio
4.2創(chuàng)建集成服務項目與SSIS包
4.3配置“旅館_ETL”數(shù)據(jù)流任務
4.3.1創(chuàng)建“旅館_ETL”對象
4.3.2配置“旅館_ETL”參數(shù)
4.4配置“人員_ETL”數(shù)據(jù)流任務
4.4.1創(chuàng)建“人員_ETL”對象
4.4.2配置“人員_ETL”參數(shù)
4.5配置“時間_ETL”數(shù)據(jù)流任務
4.5.1創(chuàng)建“時間_ETL”對象
4.5.2配置“時間_ETL”參數(shù)
4.6配置“入住_ETL”數(shù)據(jù)流任務
4.6.1創(chuàng)建“入住_ETL”對象
4.6.2配置“入住_ETL”參數(shù)
4.7部署前面配置的SSIS包
4.7.1將包另存到SSIS服務器
4.7.2創(chuàng)建作業(yè)代理
習題4
第5章聯(lián)機分析處理技術
5.1OLAP概述
5.1.1OLAP的定義
5.1.2OLAP的12條準則
5.1.3OLAP的簡要準則
5.1.4OLAP系統(tǒng)的基本結構
5.2OLAP的多維分析操作
5.2.1切片
5.2.2切塊
5.2.3旋轉
5.2.4鉆取
5.3OLAP系統(tǒng)的分類
5.3.1多維OLAP
5.3.2關系OLAP
5.3.3MOLAP與ROLAP的比較
5.3.4混合OLAP
5.4OLAP、DW與DM的關系
5.4.1OLAP、DW與DM的聯(lián)系
5.4.2OLAP、DW與DM的區(qū)別
5.4.3OLAP與DW的關系
5.4.4OLAP與DM的關系
5.5DOLAM決策支持系統(tǒng)方案
習題5
第6章警務數(shù)據(jù)倉庫的OLAP應用
6.1創(chuàng)建分析服務項目
6.1.1進入商業(yè)智能開發(fā)平臺
6.1.2創(chuàng)建分析服務項目
6.2配置項目的數(shù)據(jù)源
6.3構建數(shù)據(jù)源視圖
6.4創(chuàng)建多維數(shù)據(jù)集
6.5配置維的層次結構
6.5.1配置日期維的層次
6.5.2配置地址維的層次
6.5.3配置人員維的層次
6.5.4配置旅館維的層次
6.6添加人口來源地址維
6.7分析服務項目的部署
6.8瀏覽多維數(shù)據(jù)集
習題6
第7章數(shù)據(jù)的屬性與相似性
7.1數(shù)據(jù)集的結構
7.1.1二維表
7.1.2數(shù)據(jù)矩陣
7.2屬性的類型
7.2.1連續(xù)屬性
7.2.2離散屬性
7.2.3分類屬性
7.2.4二元屬性
7.2.5序數(shù)屬性
7.2.6數(shù)值屬性
7.3相似度與相異度
7.3.1數(shù)值屬性的距離
7.3.2分類屬性的相似度
7.3.3余弦相似度
7.3.4混合屬性的相異度
習題7
第8章關聯(lián)規(guī)則挖掘
8.1關聯(lián)規(guī)則的概念
8.1.1基本概念
8.1.2項集的性質
8.2關聯(lián)規(guī)則的Apriori算法
8.2.1發(fā)現(xiàn)頻繁項集
8.2.2產生關聯(lián)規(guī)則
8.3FP增長算法
8.3.1算法的背景
8.3.2構造FP樹
8.3.3生成頻繁項集
8.4關聯(lián)規(guī)則的評價
8.4.1支持度和置信度的不足
8.4.2相關性分析
8.5序列模式發(fā)現(xiàn)算法
8.5.1序列模式的概念
8.5.2類Apriori算法
8.6關聯(lián)規(guī)則其他算法
8.6.1頻繁項集算法優(yōu)化
8.6.2CLOSE算法
8.6.3時態(tài)關聯(lián)規(guī)則
8.6.4含負項的關聯(lián)規(guī)則
習題8
第9章分類規(guī)則挖掘
9.1分類問題概述
9.2k最近鄰分類法
9.3決策樹分類方法
9.3.1決策樹生成框架
9.3.2ID3分類方法
9.3.3決策樹的剪枝
9.3.4C4.5算法
9.4貝葉斯分類方法
9.4.1貝葉斯定理
9.4.2樸素貝葉斯分類器
9.4.3樸素貝葉斯分類方法的改進
9.5其他分類方法
習題9
第10章聚類分析方法
10.1聚類分析原理
10.1.1聚類分析概述
10.1.2聚類的數(shù)學定義
10.1.3簇的常見類型
10.1.4聚類框架及性能要求
10.1.5簇的距離
10.2劃分聚類算法
10.2.1劃分聚類框架
10.2.2劃分聚類的質量
10.2.3kmeans算法
10.2.4空簇與離群點
10.2.5k中心點算法
10.3層次聚類方法
10.3.1層次聚類策略
10.3.2AGNES算法
10.3.3DIANA算法
10.4密度聚類方法
10.4.1基本概念
10.4.2算法描述
10.4.3計算實例
10.4.4算法的性能分析
10.5聚類的質量評價
10.5.1簇的數(shù)目估計
10.5.2外部質量評價
10.5.3內部質量評價
10.6離群點挖掘
10.6.1相關問題概述
10.6.2基于距離的方法
10.6.3基于相對密度的方法
10.7其他聚類方法
習題10
第11章混合屬性數(shù)據(jù)的聚類分析
11.1混合屬性數(shù)據(jù)集聚類
11.1.1混合屬性數(shù)據(jù)普遍存在
11.1.2kprototypes算法
11.1.3kprototypes算法的不足
11.2改進的kprototypes算法
11.2.1加權頻率最大原型
11.2.2離散屬性的頻率相異度
11.2.3改進的kprototypes算法
11.3強連通聚類融合算法
11.3.1聚類融合方法
11.3.2強連通聚類融合
11.3.3聚類融合優(yōu)化算法
習題11
第12章數(shù)據(jù)流挖掘與聚類分析
12.1數(shù)據(jù)流挖掘的概念
12.1.1數(shù)據(jù)流的定義
12.1.2數(shù)據(jù)流挖掘的任務
12.2數(shù)據(jù)流處理技術
12.2.1概要數(shù)據(jù)結構
12.2.2時間傾斜技術
12.2.3數(shù)據(jù)流聚類的要求
12.2.4數(shù)據(jù)流聚類的一般步驟
12.3兩層數(shù)據(jù)流聚類框架
12.4三層數(shù)據(jù)流聚類框架
12.5最優(yōu)2k近鄰聚類算法
12.5.1算法設計動因
12.5.2定義2k最近鄰集
12.5.3在線2k最近鄰集生成
12.5.4最優(yōu)2k近鄰集算法
12.5.5最優(yōu)2k近鄰聚類算法
12.5.6實例計算結果
習題12
第13章不確定數(shù)據(jù)的聚類分析
13.1不確定數(shù)據(jù)挖掘概述
13.1.1不確定數(shù)據(jù)的產生
13.1.2不確定數(shù)據(jù)的種類
13.1.3不確定數(shù)據(jù)的聚類
13.2基于相對密度的不確定數(shù)據(jù)聚類算法
13.2.1基于相對密度的聚類思想
13.2.2不確定相異度與k最近鄰集
13.2.3不確定k最近鄰密度
13.2.4RDBCAU算法描述
13.2.5計算實例
13.3不確定分類屬性數(shù)據(jù)聚類算法
13.3.1傳統(tǒng)分類屬性相似度
13.3.2分類屬性加權相似度
13.3.3分類屬性雙重加權相似度
13.3.4不確定分類屬性雙重加權相似度
13.3.5基于連通分支的不確定分類屬性聚類算法
習題13
第14章量子計算與量子遺傳聚類算法
14.1量子計算與數(shù)據(jù)挖掘
14.1.1量子計算的誕生
14.1.2量子計算研究
14.1.3量子數(shù)據(jù)挖掘算法
14.2量子計算原理
14.2.1量子態(tài)與量子比特
14.2.2量子門與基本運算
14.2.3量子糾纏特性
14.3經典量子算法
14.3.1量子傅里葉變換
14.3.2Shor因子分解算法
14.3.3Grover算法
14.4基于3D角度編碼的量子遺傳算法
14.4.1量子遺傳算法
14.4.2量子3D角度編碼
14.4.3解空間的映射
14.4.4量子染色體更新
14.4.5量子位的變異
14.4.6QGAB3DC算法
14.5量子遺傳聚類算法
14.5.1屬性值q分位數(shù)與極差
14.5.2基于極差的廣義加權距離
14.5.3量子遺傳聚類算法
習題14
參考文獻