數(shù)據(jù)分析與數(shù)據(jù)可視化實戰(zhàn)
定 價:69 元
叢書名:數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)系列
- 作者:張延松
- 出版時間:2020/5/1
- ISBN:9787121379925
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP274;TP31
- 頁碼:300
- 紙張:
- 版次:01
- 開本:16K
本書以企業(yè)級基準數(shù)據(jù)集為實戰(zhàn)案例,系統(tǒng)地介紹了目前比較前沿、比較具有代表性的數(shù)據(jù)分析與數(shù)據(jù)可視化工具的使用方法,涵蓋了從數(shù)據(jù)管理到數(shù)據(jù)抓取、數(shù)據(jù)可視化、數(shù)據(jù)挖掘建模的整個企業(yè)級數(shù)據(jù)分析流程,使讀者能夠掌握企業(yè)級數(shù)據(jù)分析處理的基本技能,為承擔企業(yè)級數(shù)據(jù)分析處理或其他領(lǐng)域的相關(guān)任務(wù)打下基礎(chǔ)。本書可以作為經(jīng)濟、人文、社會、管理學(xué)科學(xué)生學(xué)習(xí)數(shù)據(jù)分析與數(shù)據(jù)可視化技術(shù)的入門教材,也可以作為計算機專業(yè)、信息類專業(yè)本科生的教材或參考書,同樣也可以作為企業(yè)數(shù)據(jù)分析人員的參考書。
張延松,男,博士,副教授,2010年在中國人民大學(xué)獲得計算機應(yīng)用工學(xué)博士學(xué)位,2010年進入中國人民大學(xué)應(yīng)用經(jīng)濟學(xué)博士后流動站從事博士后研究工作。2012年進入中國人民大學(xué)信息學(xué)院任教,并在中國人民大學(xué)中國調(diào)查與數(shù)據(jù)中心任職,主要研究方向為大數(shù)據(jù)分析技術(shù),內(nèi)存數(shù)據(jù)庫,數(shù)據(jù)倉庫等,在相關(guān)研究領(lǐng)域的國內(nèi)、國外學(xué)術(shù)會議及期刊已發(fā)表論文20余篇,申請多項國內(nèi)、國外發(fā)明專利,在內(nèi)存數(shù)據(jù)庫和新硬件數(shù)據(jù)庫方向已獲得12項國內(nèi)發(fā)明專利、4項美國PCT發(fā)明專利授權(quán)。2016年獲得教育部科技進步一等獎(4/7),2015年獲得中國計算機學(xué)會科技進步獎一等獎(7/10),2017年獲得北京市第十四屆哲學(xué)社會科學(xué)優(yōu)秀成果獎二等獎。
目 錄
第一篇 預(yù) 備 篇
第1章 數(shù)據(jù)分析與數(shù)據(jù)庫的初步認識
1.1 數(shù)據(jù)分析的基本概念
1.1.1 大數(shù)據(jù)與數(shù)據(jù)價值
1.1.2 數(shù)據(jù)、數(shù)據(jù)分析與數(shù)據(jù)挖掘
1.1.3 數(shù)據(jù)可視化
1.1.4 數(shù)據(jù)驅(qū)動決策
1.1.5 數(shù)據(jù)分析師在企業(yè)中扮演的角色
1.2 數(shù)據(jù)庫的基本概念
1.2.1 企業(yè)級關(guān)系型數(shù)據(jù)庫
1.2.2 主鍵與外鍵
1.2.3 維度與度量
1.2.4 日期分區(qū)
1.3 數(shù)據(jù)分析的一般流程
1.3.1 定義數(shù)據(jù)分析目標
1.3.2 數(shù)據(jù)預(yù)處理
1.3.3 數(shù)據(jù)分析與模型搭建
1.3.4 數(shù)據(jù)產(chǎn)品上線與維護
本章小結(jié)
第2章 TPC-DS 數(shù)據(jù)分析案例簡介
2.1 數(shù)據(jù)集簡介
2.2 數(shù)據(jù)集結(jié)構(gòu)解析
2.2.1 store sales網(wǎng)絡(luò)
2.2.2 catalog sales網(wǎng)絡(luò)
2.2.3 website sales網(wǎng)絡(luò)
2.2.4 inventory網(wǎng)絡(luò)
2.3 數(shù)據(jù)集字段解析
2.3.1 事實表字段解析
2.3.2 維度表字段解析
2.4 啟示與挑戰(zhàn)
本章小結(jié)
第二篇 技 能 篇
第3章 企業(yè)級數(shù)據(jù)分析環(huán)境的搭建
3.1 SQL Server 2019 數(shù)據(jù)庫管理工具
3.1.1 SQL Server 2019 安裝與配置
3.1.2 新建TPC-DS 數(shù)據(jù)庫
3.1.3 通過數(shù)據(jù)導(dǎo)入向?qū)?dǎo)入 TPC-DS 數(shù)據(jù)集
3.1.4 通過 Bulk Insert 命令導(dǎo)入 TPC-DS 數(shù)據(jù)集
3.1.5 通過數(shù)據(jù)導(dǎo)出向?qū)?dǎo)出數(shù)據(jù)
3.2 Excel Power 插件數(shù)據(jù)分析工具
3.2.1 Excel Power 插件的調(diào)用
3.2.2 Power Pivot 連接 SQL Server 2019數(shù)據(jù)庫
3.2.3 Power View 與 Power Map的調(diào)用
3.3 Power BI Desktop 數(shù)據(jù)分析工具
3.3.1 Power BI Desktop 簡介與安裝
3.3.2 Power BI Desktop 連接 SQL Server 2019 數(shù)據(jù)庫
3.4 Tableau Desktop & Prep 數(shù)據(jù)分析工具
3.4.1 Tableau Desktop & Prep 安裝與配置
3.4.2 Tableau Desktop 連接 SQL Server 2019 數(shù)據(jù)庫
3.4.3 Tableau Prep 應(yīng)用基礎(chǔ)
3.5 Python數(shù)據(jù)分析工具
3.5.1 Python簡介與安裝
3.5.2 Python 連接 SQL Server 2019 數(shù)據(jù)庫
3.5.3 通過 Python 代碼導(dǎo)入 TPC-DS 數(shù)據(jù)集
本章小結(jié)
第4章 結(jié)構(gòu)化查詢語言SQL
4.1 SQL數(shù)據(jù)查詢概述
4.2 單表查詢
4.2.1 投影操作
4.2.2 選擇操作
4.2.3 聚集操作
4.2.4 分組操作
4.2.5 排序操作
4.3 連接查詢
4.3.1 等值、非等值連接
4.3.2 自身連接
4.3.3 外連接
4.3.4 多表連接
4.4 嵌套查詢
4.4.1 包含in謂詞的子查詢
4.4.2 帶有比較運算符的相關(guān)子查詢
4.4.3 帶有any或all謂詞的子查詢
4.4.4 帶有exist謂詞的子查詢
4.5 集合查詢
4.5.1 集合并運算
4.5.2 集合交運算
4.5.3 集合差運算
4.5.4 多值列集合差運算
4.6 基于派生表的查詢
4.7 復(fù)雜查詢案例解析
4.7.1 復(fù)雜查詢案例1
4.7.2 復(fù)雜查詢案例2
4.7.3 復(fù)雜查詢案例3
4.7.4 復(fù)雜查詢案例4
4.7.5 復(fù)雜查詢案例5
4.8 SQL 語言的其他功能
4.8.1 數(shù)據(jù)定義 SQL
4.8.2 數(shù)據(jù)更新 SQL
4.8.3 視圖的定義和使用
本章小結(jié)
第5章 數(shù)據(jù)可視化基礎(chǔ)
5.1 工作界面布局
5.2 基本可視化組件
5.2.1 堆積條形圖
5.2.2 簇狀條形圖
5.2.3 折線圖
5.2.4 組合圖
5.2.5 餅狀圖與環(huán)狀圖
5.2.6 表格與矩陣
5.2.7 儀表與卡片
5.2.8 基本可視化應(yīng)用小結(jié)
5.3 進階可視化組件
5.3.1 排名圖
5.3.2 瀑布圖
5.3.3 樹狀圖
5.3.4 直方圖
5.3.5 盒須圖
5.3.6 散點圖
5.3.7 詞云圖
5.3.8 弦圖與桑基圖
5.3.9 R & Python視覺對象
5.3.10 進階可視化應(yīng)用小結(jié)
5.4 分析板塊的應(yīng)用
5.4.1 匯總功能
5.4.2 模型功能
5.4.3 自定義功能
5.5 儀表板與故事
5.5.1 創(chuàng)建儀表板
5.5.2 創(chuàng)建故事
本章小結(jié)
第三篇 實 戰(zhàn) 篇
第6章 用戶數(shù)據(jù)分析與挖掘?qū)崙?zhàn)
6.1 引言
6.2 用戶宏觀監(jiān)控儀表板設(shè)計
6.2.1 設(shè)計目的
6.2.2 可視化效果
6.2.3 組件介紹
6.2.4 小結(jié)
6.3 用戶微觀監(jiān)控儀表板設(shè)計
6.3.1 設(shè)計目的
6.3.2 可視化效果
6.3.3 組件介紹
6.3.4 小結(jié)
6.4 用戶價值識別模型(RFM模型)
6.4.1 背景簡介
6.4.2 目標定義與數(shù)據(jù)獲取
6.4.3 數(shù)據(jù)預(yù)處理與分析
6.4.4 建立模型
6.4.5 模型評價與應(yīng)用
6.4.6 小結(jié)
6.5 用戶優(yōu)惠券使用行為預(yù)測模型
6.5.1 背景簡介
6.5.2 目標定義與特征工程
6.5.3 數(shù)值質(zhì)量診斷與變量描述性統(tǒng)計
6.5.4 數(shù)據(jù)預(yù)處理
6.5.5 模型建立與效果評估
6.5.6 小結(jié)
本章小結(jié)
第7章 供應(yīng)鏈數(shù)據(jù)分析與挖掘?qū)崙?zhàn)
7.1 引言
7.2 用戶偏好維度供應(yīng)鏈監(jiān)控儀表板設(shè)計
7.2.1 設(shè)計目的
7.2.2 可視化效果
7.2.3 組件介紹
7.2.4 小結(jié)
7.3 用戶滿足維度供應(yīng)鏈監(jiān)控儀表板設(shè)計
7.3.1 設(shè)計目的
7.3.2 可視化效果
7.3.3 組件介紹
7.3.4 小結(jié)
7.4 產(chǎn)品需求量預(yù)測模型
7.4.1 背景簡介
7.4.2 數(shù)據(jù)準備
7.4.3 數(shù)據(jù)預(yù)分析
7.4.4 產(chǎn)品行為模式聚類
7.4.5 時間序列建模與效果評估
7.4.6 小結(jié)
本章小結(jié)