Python商業(yè)數(shù)據(jù)分析(大數(shù)據(jù)與人工智能系列)
定 價:56 元
叢書名:大數(shù)據(jù)與人工智能系列
- 作者:張瑾 翁張文
- 出版時間:2021/4/1
- ISBN:9787300292106
- 出 版 社:中國人民大學(xué)出版社
- 中圖法分類:TP311.561
- 頁碼:364
- 紙張:
- 版次:1
- 開本:16
為了適應(yīng)社會科學(xué)學(xué)科學(xué)生以及企業(yè)從事商業(yè)數(shù)據(jù)分析的人員需求,本書會精選部分精煉的Python語法進行講解,以最簡單直白的語言將Python用于商業(yè)數(shù)據(jù)分析的要義講明白。本書重點將圍繞商業(yè)數(shù)據(jù)分析這一核心問題介紹三部分內(nèi)容:一、以目前進行商業(yè)數(shù)據(jù)分析最主要的編程語言Python為主,介紹Python編程語法;二、介紹進行商業(yè)數(shù)據(jù)分析的主要算法和模型,包括統(tǒng)計方法、數(shù)據(jù)挖掘方法、機器學(xué)習方法以及深度學(xué)習方法;三、以商業(yè)管理中常見的應(yīng)用問題為例,介紹4-5個商業(yè)數(shù)據(jù)分析案例,包括市場營銷方面的消費者細分、在線社區(qū)中虛假評論的識別、房地產(chǎn)經(jīng)濟分析、金融投資領(lǐng)域中的行業(yè)研究報告分析等。
張瑾,中國人民大學(xué)商學(xué)院副教授,博士生導(dǎo)師,管理科學(xué)與工程系副主任、商業(yè)分析云智實驗室副主任,中國信息經(jīng)濟學(xué)會理事。獲中國信息經(jīng)濟學(xué)理論貢獻獎,教育部博士研究生學(xué)術(shù)新人獎。目前在商業(yè)大數(shù)據(jù)分析領(lǐng)域國內(nèi)外重要學(xué)術(shù)期刊與國際會議上發(fā)表學(xué)術(shù)論文30余篇,主持和參與多項國家自然科學(xué)基金委項目和重大項目。主要教學(xué)與研究領(lǐng)域包括大數(shù)據(jù)管理與分析、商務(wù)智能、電子商務(wù)、人工智能等。
目錄
第1章引言 / 1
基礎(chǔ)篇
第2章 Python簡介 / 7
2.1 發(fā)展歷程 / 7
2.2 特點 / 7
2.2.1 開源與可移植性 / 8
2.2.2 面向?qū)ο?/ 8
2.2.3 其他特點 / 8
2.3 語言標準 / 9
2.4 Python 3的安裝與運行 / 9
2.4.1 Windows / 9
2.4.2 Linux/Unix / 11
2.4.3 Mac OS / 11
2.5 思考練習題 / 12
第3章 數(shù)據(jù)類型 / 13
3.1 概述 / 13
3.1.1 變量 / 13
3.1.2 數(shù)據(jù)類型框架 / 15
3.2 數(shù)字類型 / 16
3.2.1 分類 / 16
3.2.2 相關(guān)函數(shù) / 17
3.3 列表與元組 / 18
3.3.1 序列通用操作 / 18
3.3.2 列表 / 21
3.3.3 元組 / 27
3.4 字符串 / 28
3.4.1 概述 / 28
3.4.2 字符串格式化 / 31
3.4.3 方法 / 32
3.5 字典 / 33
3.5.1 概述 / 33
3.5.2 格式化字符串 / 34
3.5.3 方法 / 35
3.6 集合 / 37
3.6.1 概述 / 37
3.6.2 方法 / 39
3.7 基本運算符 / 39
3.7.1 算術(shù)運算符 / 40
3.7.2 比較運算符 / 40
3.7.3 賦值運算符 / 40
3.7.4 其他運算符 / 41
3.7.5 運算符優(yōu)先級表 / 41
3.8 思考練習題 / 42
第4章 條件與循環(huán) / 43
4.1 條件 / 43
4.1.1 布爾變量 / 43
4.1.2 條件語句 / 43
4.2 循環(huán) / 46
4.2.1 循環(huán)語句 / 46
4.2.2 迭代方式 / 50
4.2.3 排序 / 52
4.3 列表推導(dǎo)式與其他語句 / 53
4.3.1 列表推導(dǎo)式 / 53
4.3.2 其他語句 / 54
4.4 思考練習題 / 55
第5章 函數(shù)與類 / 56
5.1 函數(shù) / 56
5.1.1 創(chuàng)建 / 56
5.1.2 參數(shù) / 59
5.1.3 作用域 / 62
5.1.4 遞歸 / 63
5.2 類 / 65
5.2.1 對象 / 65
5.2.2 類的創(chuàng)建 / 66
5.2.3 私有化與類的命名空間 / 67
5.2.4 子類與超類 / 70
5.2.5 特殊方法 / 72
5.2.6 迭代器 / 75
5.3 思考練習題 / 78
第6章 標準庫、異常與文件流 / 79
6.1 標準庫 / 79
6.1.1 概念區(qū)分:模塊、庫與標準庫 / 79
6.1.2 安裝第三方模塊 / 81
6.1.3 使用import語句導(dǎo)入模塊 / 81
6.1.4 查看模塊信息:help() / 82
6.1.5 常用標準庫之一:os / 82
6.1.6 常用標準庫之二:sys / 83
6.1.7 常用標準庫之三:time / 86
6.1.8 常用標準庫之四:random / 88
6.1.9 常用標準庫之五:re / 89
6.2 異常 / 94
6.2.1 捕捉異常:try/except語句 / 95
6.2.2 捕捉異常:try/except…else語句 / 96
6.2.3 捕捉異常:try/finally語句 / 97
6.2.4 拋出異常:raise語句 / 98
6.3 文件與流 / 98
6.3.1 打開和關(guān)閉文件 / 99
6.3.2 讀取文件內(nèi)容 / 100
6.3.3 寫入文件內(nèi)容 / 101
6.4 思考練習題 / 102
第7章 Python常用模塊 / 103
7.1 Numpy / 103
7.1.1 ndarray的創(chuàng)建 / 103
7.1.2 ndarray的常用屬性 / 105
7.1.3 ndarray的形狀改變 / 105
7.1.4 ndarray的索引與切片 / 106
7.1.5 ndarray的拷貝 / 107
7.1.6 ndarray的拼接 / 108
7.1.7 ndarray的運算 / 109
7.2 Pandas / 110
7.2.1 Series的創(chuàng)建 / 111
7.2.2 Series的索引及切片 / 112
7.2.3 DataFrame的創(chuàng)建 / 113
7.2.4 DataFrame的寫入與讀取 / 114
7.2.5 DataFrame的索引 / 115
7.2.6 DataFrame的增、刪、改、查 / 117
7.2.7 DataFrame的數(shù)據(jù)統(tǒng)計方法 / 121
7.2.8 缺失數(shù)據(jù)處理 / 124
7.2.9 數(shù)據(jù)離散化 / 125
7.3 NLTK / 126
7.3.1 分句與分詞 / 126
7.3.2 詞性標注 / 127
7.3.3 符號和停用詞處理 / 127
7.3.4 詞干提取與詞形還原 / 128
7.3.5 詞相似度計算 / 129
7.4 思考練習題 / 130
第8章 數(shù)據(jù)可視化 / 131
8.1 Matplotlib / 131
8.1.1 圖形的創(chuàng)建 / 131
8.1.2 繪制多函數(shù)圖像 / 132
8.1.3 添加圖形信息 / 135
8.1.4 不同類型的圖形 / 138
8.2 Seaborn / 141
8.2.1 直方圖 / 141
8.2.2 條形圖 / 142
8.2.3 箱線圖 / 143
8.2.4 散點圖 / 143
8.2.5 結(jié)構(gòu)化多圖網(wǎng)格 / 145
8.2.6 回歸圖 / 145
8.3 PyEcharts / 146
8.3.1 繪制地圖 / 147
8.3.2 空間流動圖 / 148
8.4 思考練習題 / 149
方法篇
第9章關(guān)聯(lián)規(guī)則 / 153
9.1 關(guān)聯(lián)規(guī)則基本概念 / 153
9.2 關(guān)聯(lián)規(guī)則挖掘方法 / 154
9.3 關(guān)聯(lián)規(guī)則興趣性的評價指標 / 157
9.3.1 提升度 / 158
9.3.2 杠桿度 / 158
9.3.3 影響度 / 158
9.4 思考練習題 / 159
第10章 分類分析 / 160
10.1 分類分析基本概念 / 160
10.2 分類方法介紹 / 161
10.2.1 決策樹分類 / 161
10.2.2 貝葉斯分類 / 169
10.2.3 支持向量機分類 / 171
10.3 分類準確率的測量方法 / 175
10.3.1 經(jīng)典的分類準確率的測量方法 / 175
10.3.2 混淆矩陣 / 176
10.4 分類準確率的提升方法 / 178
10.4.1 Bagging / 179
10.4.2 Boostinig / 180
10.5 思考練習題 / 181
第11章 聚類分析 / 182
11.1 相似度測量方法 / 182
11.1.1 數(shù)值數(shù)據(jù)的相似度 / 182
11.1.2 類別數(shù)據(jù)的相似度 / 183
11.1.3 文本數(shù)據(jù)的相似度 / 183
11.1.4 類的相似度 / 184
11.2 聚類方法介紹 / 185
11.2.1 劃分方法 / 185
11.2.2 層次方法 / 188
11.2.3 基于密度的方法 / 193
11.3 類別數(shù)量的確定方法 / 197
11.3.1 手肘法 / 197
11.3.2 輪廓系數(shù) / 199
11.3.3 Calinski-Harabasz準則 / 200
11.4 思考練習題 / 201
第12章 社會網(wǎng)絡(luò)分析 / 203
12.1 社會網(wǎng)絡(luò)的基本概念 / 203
12.1.1 度 / 204 12.1.2 最短路徑長度 / 204
12.1.3 網(wǎng)絡(luò)密度 / 204
12.1.4 聚集系數(shù) / 204
12.2 社會網(wǎng)絡(luò)的中心性 / 208
12.2.1 度中心性 / 208
12.2.2 貼近中心性 / 208
12.2.3 中介中心性 / 209
12.3 社會網(wǎng)絡(luò)的鏈接分析 / 210
12.3.1 PageRank算法 / 211
12.3.2 HITS算法 / 213
12.4 社會網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn) / 215
12.4.1 圖分割算法 / 215
12.4.2 模塊度優(yōu)化算法 / 217
12.4.3 標簽傳播算法 / 219
12.5 思考練習題 / 221
第13章 神經(jīng)網(wǎng)絡(luò) / 222
13.1 感知機 / 222
13.1.1 簡單邏輯電路 / 223
13.1.2 線性不可分的局限 / 224
13.1.3 多層感知機 / 224
13.2 神經(jīng)網(wǎng)絡(luò)基本概念 / 226
13.2.1 神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu) / 226
13.2.2 激活函數(shù) / 227
13.2.3 損失函數(shù) / 229
13.3 訓(xùn)練技巧 / 229
13.3.1 批處理 / 230
13.3.2 優(yōu)化算法 / 230
13.3.3 參數(shù)初始化 / 231
13.3.4 偏差與方差 / 232
13.3.5 超參數(shù)的設(shè)置 / 233
13.4 全連接神經(jīng)網(wǎng)絡(luò) / 233
13.5 卷積神經(jīng)網(wǎng)絡(luò) / 237
13.5.1 基本結(jié)構(gòu) / 238
13.5.2 代表性結(jié)構(gòu) / 239
13.6 循環(huán)神經(jīng)網(wǎng)絡(luò) / 243
13.6.1 基本結(jié)構(gòu) / 243
13.6.2 代表性結(jié)構(gòu) / 243
13.7 思考練習題 / 248
第14章 表征學(xué)習 / 249
14.1 文本表征學(xué)習 / 249
14.1.1 詞袋模型 / 249
14.1.2 TF-IDF模型 / 251
14.1.3 文檔主題模型 / 253
14.1.4 Word2Vec模型 / 259
14.1.5 Doc2Vec模型 / 260
14.2 網(wǎng)絡(luò)表征學(xué)習 / 263
14.2.1 DeepWalk算法 / 263
14.2.2 Node2Vec算法 / 266
14.2.3 Metapath2Vec算法 / 269
14.3 思考練習題 / 270
應(yīng)用篇
第15章網(wǎng)絡(luò)數(shù)據(jù)抓取 / 275
15.1 基礎(chǔ)知識 / 276
15.1.1 數(shù)據(jù)抓取的基本思想 / 276
15.1.2 網(wǎng)頁基礎(chǔ)知識和瀏覽器原理 / 276
15.1.3 HTML語言簡介 / 277
15.2 用Python實現(xiàn)數(shù)據(jù)爬取 / 282
15.2.1 獲得網(wǎng)頁HTML源代碼 / 283
15.2.2 通過HTML標簽定位數(shù)據(jù) / 286
15.2.3 處理“翻頁”數(shù)據(jù) / 291
15.3 數(shù)據(jù)抓取技巧 / 294
15.4 思考練習題 / 295
第16章 顧客市場細分 / 297
16.1 背景與問題 / 297
16.2 數(shù)據(jù)介紹 / 298
16.3 分析方法與結(jié)論 / 301
16.3.1 分析方法 / 301
16.3.2 分析結(jié)論 / 305
16.4 思考練習題 / 306
第17章 房地產(chǎn)服務(wù)平臺用戶需求分析 / 307
17.1 背景與問題 / 307
17.2 數(shù)據(jù)介紹 / 307
17.3 分析方法與結(jié)論 / 309
17.3.1 分析方法 / 309
17.3.2 分析結(jié)論 / 315
17.4 思考練習題 / 315
第18章 電子商務(wù)中消費者評論意見提取 / 316
18.1 背景與問題 / 316
18.2 數(shù)據(jù)介紹 / 317
18.2.1 數(shù)據(jù)獲取 / 317
18.2.2 商品屬性識別 / 319
18.2.3 屬性情感分析 / 324
18.2.4 數(shù)據(jù)轉(zhuǎn)換 / 325
18.3 分析方法與結(jié)論 / 325
18.3.1 分析方法 / 325
18.3.2 分析結(jié)論 / 329
18.4 思考練習題 / 331
第19章 知識付費中顧客滿意度分析 / 332
19.1 背景與問題 / 332
19.2 數(shù)據(jù)介紹 / 334
19.2.1 變量介紹 / 335
19.2.2 數(shù)據(jù)獲取 / 337
19.3 分析方法與結(jié)論 / 346
19.3.1 分析方法 / 346
19.3.2 分析結(jié)論 / 348
19.4 思考練習題 / 351