本書采用案例和理論相結(jié)合的形式,以Anaconda和PyCharm為開發(fā)工具,系統(tǒng)地重點闡述了利用Python進行數(shù)據(jù)預處理、分析與可視化等相關(guān)知識,講解了Python各種數(shù)據(jù)處理展示的函數(shù)方法的使用方法。全書共有6章,分別是數(shù)據(jù)分析概述、Python基礎、利用Pandas進行數(shù)據(jù)預處理、利用Pandas進行數(shù)據(jù)分析、利用Matplotlib進行數(shù)據(jù)可視化、Python數(shù)據(jù)分析與綜合應用。在教學設計中安排了知識圖譜、學習目標、知識指南、任務實訓、結(jié)果分析、鞏固訓練、每章測試等模塊。本書既可以作為本科和高職院校各專業(yè)數(shù)據(jù)分析相關(guān)課程的教材,也可以作為企業(yè)電子商務、市場營銷、數(shù)據(jù)分析人員的參考資料。
李良,男,講師,就職于蘇州工業(yè)職業(yè)技術(shù)性學院,2018年,國家精品在線開放課程《計算機應用基礎》,排名第四,主要針對大數(shù)據(jù)、人工智能等專業(yè)領(lǐng)域的教學。
第1章 數(shù)據(jù)分析概述 1
1.1 認識數(shù)據(jù)分析 1
一、數(shù)據(jù)分析背景 1
二、數(shù)據(jù)分析流程 2
三、數(shù)據(jù)分析應用 3
1.2 認識Python 3
一、Python的發(fā)展趨勢 3
二、Python的特點 4
三、Python的常用庫 4
1.3 安裝環(huán)境 6
一、安裝Anaconda 6
二、安裝PyCharm 11
三、在PyCharm中導入Anaconda環(huán)境 14
四、查看PyCharm中的安裝庫 18
1.4 數(shù)據(jù)分析概述測試題 21
第2章 Python基礎 23
2.1 Python基本操作 23
一、變量 24
二、轉(zhuǎn)義符 24
三、輸入與輸出 25
四、算術(shù)運算符 27
2.2 Python選擇結(jié)構(gòu) 29
一、關(guān)系運算符 29
二、單分支選擇結(jié)構(gòu) 30
三、雙分支選擇結(jié)構(gòu) 31
四、多分支選擇結(jié)構(gòu) 31
2.3 Python循環(huán)語句 33
一、while循環(huán)語句 34
二、for循環(huán)語句一般形式 34
2.4 Python列表操作 39
一、創(chuàng)建列表 39
二、訪問列表元素與切片列表 40
三、添加列表元素 41
四、修改列表元素 42
五、刪除列表元素 42
六、列表的常用方法 43
2.5 Python字符串操作 46
一、字符串的訪問 46
二、字符串的操作 47
2.6 Python字典操作 52
一、創(chuàng)建字典 53
二、訪問字典關(guān)鍵字 53
三、訪問字典元素 54
四、更新字典元素 54
五、刪除字典元素 55
六、利用字典創(chuàng)建二維字典 56
2.7 Python函數(shù)操作 58
一、定義函數(shù) 59
二、調(diào)用函數(shù) 59
三、匿名函數(shù) 60
2.8 Python的NumPy庫 64
一、創(chuàng)建數(shù)組對象 64
二、查看數(shù)組屬性 66
三、數(shù)組的索引與切片 67
四、NumPy隨機數(shù) 68
五、NumPy的操作 70
2.9 Python基礎測試題 72
第3章 利用Pandas進行數(shù)據(jù)預處理 74
3.1 數(shù)據(jù)的創(chuàng)建與操作 74
一、Series的創(chuàng)建與操作 75
二、DataFrame的創(chuàng)建與操作 80
3.2 數(shù)據(jù)的導入與保存 84
一、導入數(shù)據(jù)設置 84
二、導入外部文件 85
三、導入Sklearn自帶數(shù)據(jù) 86
四、保存數(shù)據(jù) 86
3.3 數(shù)據(jù)的新增與刪除 91
一、新增列數(shù)據(jù) 91
二、數(shù)據(jù)的刪除 93
3.4 數(shù)據(jù)的篩選與切片 96
一、直接選取列數(shù)據(jù) 96
二、利用loc函數(shù)選取行數(shù)據(jù) 97
三、選取DataFrame切片數(shù)據(jù) 99
3.5 數(shù)據(jù)的去空與去重 104
一、數(shù)據(jù)去空 104
二、數(shù)據(jù)去重 107
3.6 數(shù)據(jù)的填充與替換 111
一、空值填充 111
二、批量替換 113
3.7 數(shù)據(jù)的拼接和合并 117
一、數(shù)據(jù)的縱向拼接 117
二、數(shù)據(jù)的橫向合并 119
3.8 時間的轉(zhuǎn)換與提取 123
一、生成時間類數(shù)據(jù) 124
二、轉(zhuǎn)化DataFrame時間數(shù)據(jù) 126
三、提取時間信息 126
3.9 利用Pandas進行數(shù)據(jù)預處理測試題 129
第4章 利用Pandas進行數(shù)據(jù)分析 132
4.1 數(shù)據(jù)的排序與排名 132
一、數(shù)據(jù)排序 133
二、數(shù)據(jù)排名 134
4.2 數(shù)據(jù)的統(tǒng)計與描述 137
一、數(shù)值型字段的統(tǒng)計與描述 137
二、分類型字段的統(tǒng)計與描述 140
4.3 數(shù)據(jù)的分組與分段 144
一、數(shù)據(jù)分組統(tǒng)計分析 144
二、數(shù)據(jù)分段統(tǒng)計分析 147
4.4 數(shù)據(jù)的交叉與透視 149
一、頻數(shù)交叉表 149
二、數(shù)據(jù)透視表 151
4.5 數(shù)據(jù)的正態(tài)性分析 156
一、數(shù)據(jù)的正態(tài)分布 156
二、正態(tài)分布的描述 157
三、正態(tài)分布的驗證 158
4.6 數(shù)據(jù)的相關(guān)性分析 164
一、相關(guān)關(guān)系的概念 164
二、相關(guān)分析 164
4.7 利用Pandas進行數(shù)據(jù)分析測試題 169
第5章 利用Matplotlib進行數(shù)據(jù)可視化 171
5.1 繪圖設置與簡單繪圖 171
一、繪圖設置 172
二、簡單繪圖 177
5.2 繪制柱形圖 180
一、柱形圖 180
二、添加數(shù)據(jù)標簽 184
5.3 繪制條形圖 187
一、直接繪制條形圖 187
二、利用數(shù)據(jù)分組繪制條形圖 190
5.4 繪制折線圖 194
一、折線圖 194
二、添加折線圖輔助線 195
5.5 繪制散點氣泡圖 200
一、散點圖 200
二、繪制氣泡圖 202
5.6 繪制餅圖與圓環(huán)圖 208
一、繪制餅圖及其文本設置 208
二、繪制圓環(huán)圖 210
5.7 利用Matplotlib進行數(shù)據(jù)可視化測試題 214
第6章 Python數(shù)據(jù)分析與綜合應用 216
6.1 成績數(shù)據(jù)預處理與分析 216
一、數(shù)據(jù)源 216
二、要求 217
三、步驟 217
四、結(jié)論 221
6.2 房產(chǎn)數(shù)據(jù)預處理與分析 221
一、數(shù)據(jù)源 221
二、目標 222
三、步驟 222
四、結(jié)論 227
6.3 餐飲數(shù)據(jù)分析與可視化 227
一、數(shù)據(jù)源 227
二、目標 228
三、步驟 228
四、結(jié)論 235
6.4 超市數(shù)據(jù)分析與可視化 236
一、數(shù)據(jù)源 236
二、目標 237
三、步驟 238
四、結(jié)論 245
6.5 工業(yè)數(shù)據(jù)分析與可視化 246
一、數(shù)據(jù)源分析 246
二、目標 248
三、分析步驟 248
四、結(jié)論 255
附錄A 函數(shù)方法表 257
附錄B 顏色表 261
參考文獻 262