SQL Server 2017 數(shù)據(jù)庫(kù)分析處理技術(shù)
定 價(jià):69 元
叢書名:數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)系列
- 作者:張延松
- 出版時(shí)間:2019/8/1
- ISBN:9787121372780
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP311.138
- 頁(yè)碼:376
- 紙張:
- 版次:01
- 開本:16開
本書內(nèi)容主要分為三部分:第1部分導(dǎo)論,介紹SQL Server 2017的安裝及配置方法、數(shù)據(jù)導(dǎo)入方法和工具,并且通過(guò)數(shù)據(jù)可視化技術(shù)介紹數(shù)據(jù)分析處理技術(shù)的基本需求、數(shù)據(jù)模型及實(shí)現(xiàn)方法;第2部分?jǐn)?shù)據(jù)庫(kù)基礎(chǔ)知識(shí)與SQL實(shí)踐,介紹關(guān)系數(shù)據(jù)庫(kù)基礎(chǔ)理論、數(shù)據(jù)庫(kù)基礎(chǔ)實(shí)現(xiàn)技術(shù)、SQL命令及查詢實(shí)現(xiàn)技術(shù)、數(shù)據(jù)庫(kù)實(shí)現(xiàn)新技術(shù)等相關(guān)知識(shí);第3部分?jǐn)?shù)據(jù)倉(cāng)庫(kù)和OLAP基礎(chǔ),介紹數(shù)據(jù)倉(cāng)庫(kù)的基本概念及相關(guān)理論、OLAP的基本概念及相關(guān)操作、基于企業(yè)Benchmark的OLAP實(shí)踐案例。 本書采用面向數(shù)據(jù)完整生命周期的貫穿式案例教學(xué)方法,以數(shù)據(jù)的采集、加載、管理、處理、分析、優(yōu)化、數(shù)據(jù)可視化、多維展示、數(shù)據(jù)挖掘等從起點(diǎn)到終點(diǎn)的案例式處理過(guò)程,介紹數(shù)據(jù)分析處理全生命周期中相關(guān)的技術(shù),使讀者掌握全面的數(shù)據(jù)庫(kù)分析處理技術(shù),增強(qiáng)讀者獨(dú)立解決實(shí)際問(wèn)題的能力。
張延松,男,博士,副教授,2010年在中國(guó)人民大學(xué)獲得計(jì)算機(jī)應(yīng)用工學(xué)博士學(xué)位,2010年進(jìn)入中國(guó)人民大學(xué)應(yīng)用經(jīng)濟(jì)學(xué)博士后流動(dòng)站從事博士后研究工作。2012年進(jìn)入中國(guó)人民大學(xué)信息學(xué)院任教,并在中國(guó)人民大學(xué)中國(guó)調(diào)查與數(shù)據(jù)中心任職,主要研究方向?yàn)榇髷?shù)據(jù)分析技術(shù),內(nèi)存數(shù)據(jù)庫(kù),數(shù)據(jù)倉(cāng)庫(kù)等,在相關(guān)研究領(lǐng)域的國(guó)內(nèi)、國(guó)外學(xué)術(shù)會(huì)議及期刊已發(fā)表論文20余篇,申請(qǐng)多項(xiàng)國(guó)內(nèi)、國(guó)外發(fā)明專利,在內(nèi)存數(shù)據(jù)庫(kù)和新硬件數(shù)據(jù)庫(kù)方向已獲得12項(xiàng)國(guó)內(nèi)發(fā)明專利、4項(xiàng)美國(guó)PCT發(fā)明專利授權(quán)。2016年獲得教育部科技進(jìn)步一等獎(jiǎng)(4/7),2015年獲得中國(guó)計(jì)算機(jī)學(xué)會(huì)科技進(jìn)步獎(jiǎng)一等獎(jiǎng)(7/10),2017年獲得北京市第十四屆哲學(xué)社會(huì)科學(xué)優(yōu)秀成果獎(jiǎng)二等獎(jiǎng)。
第1部分 導(dǎo) 論
第1章 初識(shí)SQL Server 2017 2
1.1 SQL Server 2017在Windows平臺(tái)的安裝與配置 2
1.2 SQL Server 2017在Linux平臺(tái)的安裝與配置 7
1.3 SQL Server數(shù)據(jù)庫(kù)數(shù)據(jù)導(dǎo)入和導(dǎo)出 14
1.3.1 從Access文件向SQL Server導(dǎo)入數(shù)據(jù) 15
1.3.2 通過(guò)BULK INSERT命令導(dǎo)入平面數(shù)據(jù)文件 17
1.3.3 通過(guò)數(shù)據(jù)導(dǎo)入和導(dǎo)出向?qū)?dǎo)入平面數(shù)據(jù)文件 22
1.4 使用Integration Services導(dǎo)入數(shù)據(jù) 29
小結(jié) 39
第2章 數(shù)據(jù)分析與數(shù)據(jù)庫(kù)的初步認(rèn)識(shí) 40
2.1 Excel數(shù)據(jù)分析工具 40
2.1.1 Excel表單數(shù)據(jù)操作 40
2.1.2 Power Pivot for Excel 41
2.1.3 Power Map 45
2.2 Power BI Desktop數(shù)據(jù)分析工具 46
2.2.1 數(shù)據(jù)管理 46
2.2.2 數(shù)據(jù)分析與可視化報(bào)表 50
2.2.3 數(shù)據(jù)發(fā)布與訪問(wèn) 53
2.3 Tableau數(shù)據(jù)可視化分析工具 54
2.3.1 數(shù)據(jù)連接與管理 55
2.3.2 可視化分析 57
2.3.3 創(chuàng)建儀表板和故事 62
小結(jié) 64
第2部分 數(shù)據(jù)庫(kù)基礎(chǔ)知識(shí)與SQL實(shí)踐
第3章 數(shù)據(jù)庫(kù)基礎(chǔ)知識(shí) 66
3.1 數(shù)據(jù)庫(kù)的基本概念 66
3.1.1 數(shù)據(jù)、數(shù)據(jù)庫(kù)、數(shù)據(jù)庫(kù)管理系統(tǒng)、數(shù)據(jù)庫(kù)系統(tǒng) 66
3.1.2 數(shù)據(jù)庫(kù)系統(tǒng)的特點(diǎn) 69
3.2 關(guān)系數(shù)據(jù)模型 71
3.2.1 實(shí)體?聯(lián)系模型 72
3.2.2 關(guān)系 72
3.2.3 關(guān)系模式 75
3.2.4 碼 77
3.2.5 規(guī)范化 79
3.2.6 完整性約束 88
3.3 關(guān)系操作與關(guān)系代數(shù) 95
3.3.1 關(guān)系操作 95
3.3.2 關(guān)系代數(shù)與關(guān)系運(yùn)算 96
3.4 數(shù)據(jù)庫(kù)系統(tǒng)結(jié)構(gòu) 105
3.4.1 內(nèi)模式(Internal Schema) 105
3.4.2 模式(Schema) 108
3.4.3 外模式(External Schema) 109
3.4.4 數(shù)據(jù)庫(kù)的二級(jí)映像與數(shù)據(jù)獨(dú)立性 109
3.5 數(shù)據(jù)庫(kù)系統(tǒng)的組成 110
3.5.1 數(shù)據(jù)庫(kù)硬件平臺(tái) 110
3.5.2 數(shù)據(jù)庫(kù)軟件 112
3.5.3 數(shù)據(jù)庫(kù)人員 113
小結(jié) 114
第4章 關(guān)系數(shù)據(jù)庫(kù)結(jié)構(gòu)化查詢語(yǔ)言SQL 115
4.1 SQL概述 115
4.2 數(shù)據(jù)定義SQL 119
4.2.1 模式的定義與刪除 119
4.2.2 表的定義、刪除與修改 121
4.2.3 代表性的索引技術(shù) 127
4.2.4 索引的創(chuàng)建與刪除 134
4.3 數(shù)據(jù)查詢SQL 136
4.3.1 單表查詢 137
4.3.2 連接查詢 147
4.3.3 嵌套查詢 152
4.3.4 集合查詢 158
4.3.5 基于派生表查詢 161
4.4 數(shù)據(jù)更新SQL 162
4.4.1 插入數(shù)據(jù) 162
4.4.2 修改數(shù)據(jù) 164
4.4.3 刪除數(shù)據(jù) 165
4.4.4 事務(wù) 165
4.5 視圖的定義和使用 166
4.5.1 定義視圖 166
4.5.2 查詢視圖 168
4.5.3 更新視圖 169
4.6 面向大數(shù)據(jù)管理的SQL擴(kuò)展語(yǔ)法 172
4.6.1 HiveQL 172
4.6.2 JSON數(shù)據(jù)管理 175
4.6.3 圖數(shù)據(jù)管理 179
小結(jié) 183
第5章 數(shù)據(jù)庫(kù)實(shí)現(xiàn)與查詢優(yōu)化技術(shù) 185
5.1 數(shù)據(jù)庫(kù)查詢處理實(shí)現(xiàn)技術(shù)和查詢優(yōu)化技術(shù)的基本原理 185
5.1.1 表存儲(chǔ)結(jié)構(gòu) 185
5.1.2 緩沖區(qū)管理 189
5.1.3 索引查詢優(yōu)化技術(shù) 190
5.1.4 基于代價(jià)模型的查詢優(yōu)化 196
5.2 內(nèi)存查詢優(yōu)化技術(shù) 201
5.2.1 內(nèi)存表 202
5.2.2 列存儲(chǔ)索引 205
5.3 查詢優(yōu)化案例分析 209
5.4 代表性的關(guān)系數(shù)據(jù)庫(kù) 226
小結(jié) 232
第3部分 數(shù)據(jù)倉(cāng)庫(kù)和OLAP基礎(chǔ)
第6章 數(shù)據(jù)倉(cāng)庫(kù)和OLAP 236
6.1 數(shù)據(jù)倉(cāng)庫(kù) 236
6.1.1 數(shù)據(jù)倉(cāng)庫(kù)的概念 236
6.1.2 數(shù)據(jù)倉(cāng)庫(kù)的特征 237
6.1.3 數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu) 238
6.1.4 數(shù)據(jù)倉(cāng)庫(kù)的實(shí)現(xiàn)技術(shù) 241
6.2 OLAP聯(lián)機(jī)分析處理 249
6.2.1 多維數(shù)據(jù)模型 250
6.2.2 OLAP操作 251
6.2.3 OLAP實(shí)現(xiàn)技術(shù) 255
6.2.4 OLAP存儲(chǔ)模型設(shè)計(jì) 256
6.3 數(shù)據(jù)倉(cāng)庫(kù)案例分析 264
6.3.1 TPC-H 265
6.3.2 SSB 274
6.3.3 TPC-DS 276
小結(jié) 287
第7章 OLAP實(shí)踐案例 288
7.1 基于SSB數(shù)據(jù)庫(kù)的OLAP案例實(shí)踐 288
7.1.1 SSB數(shù)據(jù)集分析 288
7.1.2 創(chuàng)建Analysis Services數(shù)據(jù)源 292
7.1.3 創(chuàng)建數(shù)據(jù)源視圖 295
7.1.4 創(chuàng)建多維數(shù)據(jù)集 297
7.1.5 創(chuàng)建維度 301
7.1.6 多維分析 307
7.1.7 通過(guò)Excel數(shù)據(jù)透視表查看多維數(shù)據(jù)集 308
7.2 基于FoodMart數(shù)據(jù)庫(kù)的OLAP案例實(shí)踐 311
7.3 基于TPC-H數(shù)據(jù)庫(kù)的OLAP案例實(shí)踐 326
7.4 SQL Server 2017內(nèi)置統(tǒng)計(jì)功能 338
7.4.1 系統(tǒng)安裝配置 338
7.4.2 SQL Server 2017 R腳本執(zhí)行案例 340
7.4.3 SQL Server 2017 R腳本執(zhí)行與Analysis Services中統(tǒng)計(jì)功能 342
7.4.4 Analysis Services中常見的數(shù)據(jù)挖掘功能 351
7.4.5 SQL Server 2017 Python腳本執(zhí)行 361
小結(jié) 364
參考文獻(xiàn) 365