Python+Superset:商業(yè)智能數(shù)據(jù)分析與實戰(zhàn)
定 價:79 元
- 作者:王國平
- 出版時間:2022/2/1
- ISBN:9787121428654
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP311.561
- 頁碼:248
- 紙張:
- 版次:01
- 開本:16開
本書通過實際案例深入介紹了基于Python的開源商業(yè)智能工具Apache Superset。本書立足于為企業(yè)建立一套開源免費的BI(商業(yè)智能)數(shù)據(jù)分析平臺,實現(xiàn)自助數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)可視化,概述了該系統(tǒng)的基本情況、總體需求、解決方案和業(yè)務理解等。本書從企業(yè)BI系統(tǒng)建設的實際需求出發(fā),詳細闡述了商業(yè)智能系統(tǒng)開發(fā)的概念、流程及相關技術,同時結合實際案例介紹了基于Apache Superset的最新且常用的商業(yè)智能技術,包括Redis、Hive、Presto、Vertica、ClickHouse、TiDB、Dremio等。
王國平:具有十余年金融、電力、互聯(lián)網(wǎng)等行業(yè)從業(yè)經(jīng)歷,現(xiàn)已出版十余部專著。擅長數(shù)據(jù)分析、數(shù)據(jù)可視化、機器學習等,精通Python、SPSS、Tableau、Power BI等數(shù)據(jù)分析工具,熟悉MySQL、SQL Server等數(shù)據(jù)庫,以及Hadoop、Hive、Zeppelin、Spark等大數(shù)據(jù)分析及可視化工具。
第1章 商業(yè)智能概述 1
1.1 商業(yè)智能簡介 1
1.1.1 商業(yè)智能的發(fā)展 1
1.1.2 商業(yè)智能的價值 3
1.1.3 商業(yè)智能的流程 4
1.2 商業(yè)智能技術 4
1.2.1 數(shù)據(jù)倉庫技術 4
1.2.2 ETL技術 6
1.2.3 數(shù)據(jù)可視化技術 6
1.3 幾個概念的比較 10
1.3.1 商業(yè)智能與報表工具 10
1.3.2 商業(yè)智能與數(shù)據(jù)分析 11
1.3.3 商業(yè)智能與數(shù)據(jù)可視化 11
第2章 系統(tǒng)開發(fā)需求分析 12
2.1 項目背景概述 12
2.1.1 項目意義與需求 12
2.1.2 項目目標、系統(tǒng)設計與階段劃分 16
2.2 平臺總體需求 18
2.2.1 平臺總體規(guī)劃 19
2.2.2 平臺用戶角色 20
2.3 解決方案概述 21
2.3.1 BI平臺功能簡介 21
2.3.2 BI平臺總體架構 22
2.4 業(yè)務數(shù)據(jù)理解 23
2.4.1 表及其字段含義 24
2.4.2 重要需求點闡述 28
第3章 系統(tǒng)開發(fā)相關技術 31
3.1 系統(tǒng)主要軟件 31
3.1.1 Hadoop 31
3.1.2 Python 34
3.1.3 Apache Superset 35
3.2 數(shù)據(jù)倉庫技術 37
3.2.1 數(shù)據(jù)倉庫構建過程 37
3.2.2 數(shù)據(jù)倉庫拉鏈算法 38
3.3 Apache Superset的安裝 39
3.3.1 在Docker中部署Apache Superset 39
3.3.2 在Windows下安裝Apache Superset 44
第4章 Apache Superset連接數(shù)據(jù)源 47
4.1 讀取本地數(shù)據(jù) 47
4.1.1 讀取CSV文件 47
4.1.2 讀取TXT文件 51
4.2 連接關系型數(shù)據(jù)庫 51
4.2.1 安裝驅動程序 52
4.2.2 配置連接參數(shù) 53
4.2.3 添加數(shù)據(jù)庫表 58
第5章 Apache Superset基礎操作 61
5.1 Apache Superset可視化分析 61
5.1.1 SQL Lab提取數(shù)據(jù) 61
5.1.2 制作報表與看板 64
5.2 Apache Superset用戶管理 68
5.2.1 創(chuàng)建新的系統(tǒng)用戶 68
5.2.2 刪除已有系統(tǒng)用戶 70
5.2.3 查看用戶日志記錄 71
5.3 Apache Superset角色管理 72
5.3.1 設置用戶角色類型 73
5.3.2 創(chuàng)建新的用戶角色 73
5.3.3 修改用戶角色類型 75
5.4 Apache Superset看板設置與編輯 77
5.4.1 Apache Superset看板設置 77
5.4.2 Apache Superset看板編輯 81
第6章 Apache Superset前端集成開發(fā) 84
6.1 前端開發(fā)概述 84
6.1.1 HTML及其應用案例 84
6.1.2 JavaScript及其特點 88
6.2 系統(tǒng)參數(shù)設置 89
6.3 Apache Superset前端集成實戰(zhàn) 90
6.3.1 報表嵌入Web頁面 90
6.3.2 看板嵌入Web頁面 97
第7章 Apache Superset系統(tǒng)性能優(yōu)化 100
7.1 系統(tǒng)性能優(yōu)化 100
7.2 搭建開發(fā)環(huán)境 102
7.2.1 Redis緩存概述 102
7.2.2 配置Redis環(huán)境 104
7.3 集成開發(fā)實戰(zhàn) 106
7.3.1 測試集成前看板 106
7.3.2 刷新集成后看板 108
第8章 Apache Superset與數(shù)據(jù)倉庫 109
8.1 數(shù)據(jù)倉庫概述 109
8.1.1 傳統(tǒng)數(shù)據(jù)倉庫 109
8.1.2 大數(shù)據(jù)數(shù)據(jù)倉庫 111
8.2 Apache Superset集成Hive 113
8.2.1 Hive數(shù)據(jù)倉庫概述 113
8.2.2 搭建Hive開發(fā)環(huán)境 115
8.3 物流配送影響因素分析 117
第9章 Apache Superset與實時計算引擎 121
9.1 實時計算引擎概述 121
9.1.1 實時計算應用場景 121
9.1.2 實時計算重要架構 123
9.2 Apache Superset集成Presto 126
9.2.1 Presto計算引擎概述 126
9.2.2 搭建Presto開發(fā)環(huán)境 128
9.3 網(wǎng)購退貨原因分析 132
9.3.1 網(wǎng)購退貨主要原因 132
9.3.2 個人原因退貨分析 134
第10章 Apache Superset與列式存儲引擎 136
10.1 列式存儲引擎 136
10.2 Apache Superset集成Vertica 138
10.2.1 Vertica存儲引擎概述 138
10.2.2 搭建Vertica開發(fā)環(huán)境 140
10.3 客戶流失原因分析 144
10.3.1 客戶流失主要原因 144
10.3.2 客戶流失服務因素分析 145
第11章 Apache Superset與聯(lián)機分析處理 147
11.1 聯(lián)機分析處理概述 147
11.1.1 聯(lián)機分析處理特性 147
11.1.2 聯(lián)機分析處理操作 149
11.2 Apache Superset集成ClickHouse 150
11.2.1 ClickHouse存儲引擎概述 151
11.2.2 搭建ClickHouse開發(fā)環(huán)境 152
13.3 商家物流運營分析 155
11.3.1 物流運營主要模式 156
11.3.2 商家交貨周期分析 157
第12章 Apache Superset與混合事務分析處理 159
12.1 混合事務分析處理 159
12.1.1 混合事務分析處理概述 159
12.1.2 混合事務分析處理操作 161
12.2 Apache Superset集成TiDB 163
12.2.1 TiDB存儲引擎概述 163
12.2.2 搭建TiDB開發(fā)環(huán)境 166
12.3 物流配送溝通性 168
12.3.1 物流配送溝通性概述 169
12.3.2 物流配送溝通性分析 169
第13章 Apache Superset與數(shù)據(jù)湖引擎 172
13.1 數(shù)據(jù)湖引擎 172
13.1.1 數(shù)據(jù)湖引擎概述 172
13.1.2 數(shù)據(jù)湖與數(shù)據(jù)倉庫 173
13.2 Apache Superset集成Dremio 174
13.2.1 Dremio引擎概述 175
13.2.2 搭建Dremio開發(fā)環(huán)境 176
13.3 客戶流失價格因素 182
13.3.1 客戶流失價格因素概述 182
13.3.2 客戶流失價格因素分析 182
第14章 客戶細分主題分析 184
14.1 客戶細分的價值及其方法 184
14.1.1 客戶細分的概念 184
14.1.2 客戶細分的目的 185
14.1.3 客戶細分的方法 185
14.2 基于客戶屬性的客戶細分 187
14.2.1 提取SQL數(shù)據(jù)庫數(shù)據(jù) 187
14.2.2 制作可視化分析報表 188
14.2.3 基于屬性的細分看板 192
14.3 基于客戶價值的客戶細分 193
14.3.1 提取SQL數(shù)據(jù)庫數(shù)據(jù) 193
14.3.2 制作可視化分析報表 194
14.3.3 基于價值的細分看板 198
14.4 基于消費行為的客戶細分 199
14.4.1 RFM模型及客戶價值類型 199
14.4.2 提取與清洗SQL數(shù)據(jù) 200
14.4.3 制作可視化分析報表 204
14.4.4 基于行為的細分看板 208
14.5 對細分客戶進行營銷 208
第15章 客戶滿意度主題分析 211
15.1 客戶滿意度概述 211
15.2 客戶滿意信賴度分析 214
15.3 客戶滿意專業(yè)度分析 215
15.4 客戶滿意有形度分析 217
15.5 客戶滿意同理度分析 218
15.6 客戶滿意反應度分析 220
15.7 提升客戶滿意度 221
附錄A 安裝Python 3.10.0 224
附錄B 集群各節(jié)點的參數(shù)配置 228
B.1 Hadoop的參數(shù)配置 228
B.2 Hive的參數(shù)配置 231
B.3 集群的啟動與關閉 233
附錄C 數(shù)據(jù)源及其連接方式 234