數(shù)據(jù)倉庫與數(shù)據(jù)挖掘應用教程(21世紀高等學校電子商務專業(yè)規(guī)劃教材)
定 價:39.5 元
叢書名:21世紀高等學校電子商務專業(yè)規(guī)劃教材
- 作者:李春葆、蔣林、陳良臣、喻丹丹、曾平
- 出版時間:2016/9/30
- ISBN:9787302430773
- 出 版 社:清華大學出版社
- 中圖法分類:TP311.13
- 頁碼:302
- 紙張:膠版紙
- 版次:1
- 開本:16K
本書以SQL Server分析服務為環(huán)境介紹數(shù)據(jù)倉庫和數(shù)據(jù)挖掘應用技術,包括數(shù)據(jù)倉庫和數(shù)據(jù)挖掘概述、OLAP和多維數(shù)據(jù)模型、數(shù)據(jù)倉庫設計和SQL Server數(shù)據(jù)倉庫開發(fā)實例、關聯(lián)分析算法、決策樹分類算法、貝葉斯分類算法、神經(jīng)網(wǎng)絡算法、回歸分析算法、時間序列分析和聚類算法。
本書內容翔實,循序漸進地介紹各個知識點,并提供全面而豐富的教學資源,可作為各類高等院校計算機及相關專業(yè)“數(shù)據(jù)倉庫和數(shù)據(jù)挖掘應用技術”和“SQL Server高級應用”課程的教學用書,也適合計算機應用人員和計算機愛好者參考。
內容全面、知識點詳實:在內容講授上力求詳實和全面,細致解析每個知識點和各知識點的聯(lián)系。
條理清晰、講解透徹:從介紹數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的基本概念出發(fā),由簡單到復雜,循序漸進介紹數(shù)據(jù)倉庫和數(shù)據(jù)挖掘系統(tǒng)的開發(fā)過程。
精選實例、實用性強:列舉了大量的應用示例,讀者通過上機模仿可以大大提高使用應用系統(tǒng)開發(fā)能力。
配套教學資源豐富:提供了教學PPT、書中所有示例代碼、相關數(shù)據(jù)庫文件和ETL源程序。便于讀者打開和調試。
第1章數(shù)據(jù)倉庫和數(shù)據(jù)挖掘概述
1.1數(shù)據(jù)倉庫概述
1.1.1數(shù)據(jù)倉庫的定義
1.1.2數(shù)據(jù)倉庫與操作型數(shù)據(jù)庫的關系
1.1.3數(shù)據(jù)倉庫的應用
1.2數(shù)據(jù)倉庫系統(tǒng)及開發(fā)工具
1.2.1數(shù)據(jù)倉庫系統(tǒng)的組成
1.2.2數(shù)據(jù)倉庫系統(tǒng)開發(fā)工具
1.3商業(yè)智能和數(shù)據(jù)倉庫
1.3.1什么是商業(yè)智能
1.3.2商業(yè)智能和數(shù)據(jù)倉庫的關系
1.4數(shù)據(jù)挖掘概述
1.4.1數(shù)據(jù)挖掘的定義
1.4.2數(shù)據(jù)挖掘的主要任務
1.4.3數(shù)據(jù)挖掘的對象
1.4.4數(shù)據(jù)挖掘的知識表示
1.4.5數(shù)據(jù)挖掘與數(shù)據(jù)倉庫及OLAP的關系
1.4.6數(shù)據(jù)挖掘的應用
1.5數(shù)據(jù)挖掘過程
1.5.1數(shù)據(jù)挖掘步驟
1.5.2數(shù)據(jù)清理
1.5.3數(shù)據(jù)集成
1.5.4數(shù)據(jù)變換
1.5.5數(shù)據(jù)歸約
1.5.6離散化和概念分層生成
1.5.7數(shù)據(jù)挖掘的算法
練習題
第2章OLAP和多維數(shù)據(jù)模型
2.1OLAP概述
2.1.1什么是OLAP
2.1.2OLAP和OLTP的區(qū)別
2.1.3數(shù)據(jù)倉庫與OLAP的關系
2.2多維數(shù)據(jù)模型
2.2.1多維數(shù)據(jù)模型的相關概念
2.2.2OLAP的基本分析操作
2.2.3多維數(shù)據(jù)模型的實現(xiàn)途徑
2.3數(shù)據(jù)倉庫的維度建模
2.3.1數(shù)據(jù)倉庫建模概述
2.3.2星形模型
2.3.3雪花模型
2.3.4事實星座模型
練習題
第3章數(shù)據(jù)倉庫設計
3.1數(shù)據(jù)倉庫設計概述
3.1.1數(shù)據(jù)倉庫設計原則
3.1.2建立數(shù)據(jù)倉庫系統(tǒng)的兩種模式
3.1.3數(shù)據(jù)倉庫設計過程
3.2數(shù)據(jù)倉庫規(guī)劃與需求分析
3.2.1數(shù)據(jù)倉庫規(guī)劃
3.2.2數(shù)據(jù)倉庫需求分析
3.3數(shù)據(jù)倉庫建模
3.3.1數(shù)據(jù)倉庫建模的主要工作
3.3.2維表設計
3.3.3事實表設計
3.4數(shù)據(jù)倉庫物理模型設計
3.4.1確定數(shù)據(jù)的存儲結構
3.4.2確定索引策略
3.4.3確定存儲分配
3.5數(shù)據(jù)倉庫部署與維護
3.5.1數(shù)據(jù)倉庫的部署
3.5.2數(shù)據(jù)倉庫的維護
練習題
第4章SQLServer數(shù)據(jù)倉庫開發(fā)實例
4.1OnRetDW系統(tǒng)需求分析
4.1.1OnRetDW系統(tǒng)的主題
4.1.2OnRetDW系統(tǒng)的功能
4.2OnRetDW的建模
4.2.1維表設計
4.2.2事實表設計
4.3數(shù)據(jù)抽取工具設計
4.4基于SQL Server 2012設計OnRetDW
4.4.1創(chuàng)建數(shù)據(jù)倉庫OnRetDW項目
4.4.2創(chuàng)建數(shù)據(jù)源
4.4.3創(chuàng)建數(shù)據(jù)源視圖
4.4.4創(chuàng)建維表
4.4.5創(chuàng)建多維數(shù)據(jù)集
4.4.6部署SDWS
4.4.7瀏覽已部署的多維數(shù)據(jù)集
4.5MDX簡介*
4.5.1MDX語言概述
4.5.2執(zhí)行MDX查詢
4.5.3多維數(shù)據(jù)查詢
練習題
上機實驗題
第5章關聯(lián)分析算法
5.1關聯(lián)分析概述
5.1.1什么是關聯(lián)分析
5.1.2事務數(shù)據(jù)庫
5.1.3關聯(lián)規(guī)則及其度量
5.1.4頻繁項集
5.1.5挖掘關聯(lián)規(guī)則的基本過程
5.2Apriori算法
5.2.1Apriori性質
5.2.2Apriori算法求頻繁項集
5.2.3由頻繁項集產(chǎn)生強關聯(lián)規(guī)則
5.3SQL Server挖掘關聯(lián)規(guī)則
5.3.1創(chuàng)建DMK數(shù)據(jù)庫
5.3.2建立關聯(lián)挖掘項目
5.3.3部署關聯(lián)挖掘項目并瀏覽結果
5.4電子商務數(shù)據(jù)的關聯(lián)規(guī)則挖掘
5.4.1創(chuàng)建OnRetDMK數(shù)據(jù)庫
5.4.2數(shù)據(jù)加載功能設計
5.4.3建立關聯(lián)挖掘項目
5.4.4部署關聯(lián)挖掘項目并瀏覽結果
練習題
上機實驗題
第6章決策樹分類算法
6.1分類過程
6.1.1分類概述
6.1.2分類過程的學習階段
6.1.3分類過程的分類階段
6.2決策樹分類
6.2.1決策樹
6.2.2建立決策樹的ID3算法
6.3SQL Server決策樹分類
6.3.1建立數(shù)據(jù)表
6.3.2建立決策樹分類挖掘模型
6.3.3瀏覽決策樹模型和分類預測
6.4電子商務數(shù)據(jù)的決策樹分類
6.4.1創(chuàng)建OnRetDMK.DST數(shù)據(jù)表
6.4.2數(shù)據(jù)加載功能設計
6.4.3建立決策樹分類模型
6.4.4瀏覽決策樹
練習題
上機實驗題
第7章貝葉斯分類算法
7.1貝葉斯分類概述
7.1.1貝葉斯定理
7.1.2貝葉斯信念網(wǎng)絡
7.2樸素貝葉斯分類
7.2.1樸素貝葉斯分類原理
7.2.2樸素貝葉斯分類算法
7.3SQL Server樸素貝葉斯分類
7.3.1建立樸素貝葉斯分類挖掘模型
7.3.2瀏覽樸素貝葉斯分類模型和分類預測
7.4電子商務數(shù)據(jù)的貝葉斯分類
7.4.1建立樸素貝葉斯分類挖掘模型
7.4.2瀏覽挖掘結果及分析
練習題
上機實驗題
第8章神經(jīng)網(wǎng)絡算法
8.1人工神經(jīng)網(wǎng)絡概述
8.1.1人工神經(jīng)元
8.1.2人工神經(jīng)網(wǎng)絡
8.1.3神經(jīng)網(wǎng)絡應用
8.2用于分類的前饋神經(jīng)網(wǎng)絡
8.2.1前饋神經(jīng)網(wǎng)絡的學習過程
8.2.2前饋神經(jīng)網(wǎng)絡用于分類的算法
8.3SQL Server神經(jīng)網(wǎng)絡分類
8.3.1建立神經(jīng)網(wǎng)絡分類挖掘模型
8.3.2瀏覽神經(jīng)網(wǎng)絡分類模型和分類預測
8.4電子商務數(shù)據(jù)的神經(jīng)網(wǎng)絡分類
8.4.1建立神經(jīng)網(wǎng)絡分類挖掘模型
8.4.2瀏覽挖掘結果及分析
練習題
上機實驗題
第9章回歸分析算法
9.1回歸分析概述
9.2線性回歸分析
9.2.1一元線性回歸分析
9.2.2多元線性回歸分析
9.2.3SQL Server線性回歸分析
9.3非線性回歸分析
9.3.1非線性回歸分析的處理方法
9.3.2可轉換成線性回歸的非線性回歸
9.3.3不可變換成線性回歸的非線性回歸分析*
9.4邏輯回歸分析
9.4.1邏輯回歸原理
9.4.2邏輯回歸模型
9.4.3SQL Server邏輯回歸分析
9.5電子商務數(shù)據(jù)的邏輯回歸分析
9.5.1建立邏輯回歸挖掘模型
9.5.2瀏覽挖掘結果及分析
練習題
上機實驗題
第10章時間序列分析
10.1時間序列分析概述
10.1.1什么是時間序列和時間序列分析
10.1.2時間序列的分類和平穩(wěn)性判斷
10.1.3時間序列建模的兩種基本假設
10.1.4回歸分析與時間序列分析
10.2確定性時間序列分析
10.2.1移動平均模型
10.2.2指數(shù)平滑模型
10.3隨機時間序列模型*
10.3.1隨機時間序列模型概述
10.3.2自回歸模型AR(p)
10.4SQL Server時間序列分析
10.4.1建立數(shù)據(jù)表
10.4.2建立時間序列分析模型
10.4.3瀏覽時間序列分析模型
10.5電子商務數(shù)據(jù)的時間序列分析
10.5.1創(chuàng)建OnRetDMK.TS數(shù)據(jù)表
10.5.2數(shù)據(jù)加載功能設計
10.5.3建立時間序列分析模型
10.5.4瀏覽時間序列分析模型
練習題
上機實驗題
第11章聚類算法
11.1聚類概述
11.1.1什么是聚類
11.1.2相似性度量
11.1.3聚類過程
11.1.4常見的聚類算法
11.1.5聚類分析的應用
11.2k均值算法及其應用
11.2.1k均值算法
11.2.2SQL Server的k均值算法應用
11.3EM算法及其應用
11.3.1EM算法
11.3.2SQL Server中EM算法
11.4電子商務數(shù)據(jù)的聚類分析
11.4.1建立聚類挖掘模型
11.4.2兩種算法結果的比較
11.5Microsoft順序分析和聚類分析算法*
11.5.1Microsoft順序分析和聚類分析算法概述
11.5.2Microsoft順序分析和聚類分析算法的應用
練習題
上機實驗題
附錄A部分練習題參考答案
第1章
第2章
第3章
第4章
第5章
第6章
第7章
第8章
第9章
第10章
第11章
附錄B上機實驗題參考答案
第4章
第5章
第6章
第7章
第8章
第9章
第10章
第11章
附錄C書中數(shù)據(jù)庫和包含的數(shù)據(jù)表
1. OnRet數(shù)據(jù)庫
2. SDW數(shù)據(jù)庫
3. OnRetDMK數(shù)據(jù)庫
4. DMK數(shù)據(jù)庫
參考文獻