Pandas入門(mén)與實(shí)戰(zhàn)應(yīng)用 :基于Python的數(shù)據(jù)分析與處理
定 價(jià):89 元
- 作者:周峰
- 出版時(shí)間:2022/8/1
- ISBN:9787121440700
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP311.561
- 頁(yè)碼:388
- 紙張:
- 版次:01
- 開(kāi)本:16開(kāi)
本書(shū)首先講解Pandas快速入門(mén)的基礎(chǔ)知識(shí),如Pandas的定義、可處理的數(shù)據(jù)類型、優(yōu)勢(shì)、開(kāi)發(fā)環(huán)境配置、常用的數(shù)據(jù)結(jié)構(gòu)等;然后通過(guò)實(shí)例剖析講解Pandas數(shù)據(jù)的導(dǎo)入、導(dǎo)出、查看、清洗、合并、對(duì)比、預(yù)處理;接著講解Pandas數(shù)據(jù)的提取、篩選、匯總、統(tǒng)計(jì)及可視化;然后講解Pandas數(shù)據(jù)的線性模型和廣義線性模型,最后講解Pandas數(shù)據(jù)實(shí)戰(zhàn)分析。在講解過(guò)程中即考慮讀者的學(xué)習(xí)習(xí)慣,又通過(guò)具體實(shí)例剖析講解Pandas實(shí)戰(zhàn)應(yīng)用中的熱點(diǎn)問(wèn)題、關(guān)鍵問(wèn)題及種種難題。
周峰,畢業(yè)于青島海洋大學(xué)計(jì)算機(jī)科學(xué)與應(yīng)用專業(yè)。曾先后就職于青島商業(yè)中專和青島遠(yuǎn)洋學(xué)院計(jì)算機(jī)系,從事計(jì)算機(jī)輔助設(shè)計(jì)的教學(xué)與研究。曾出版作品如下:《C語(yǔ)言實(shí)用程序設(shè)計(jì)100例》 《VB控件實(shí)用程序設(shè)計(jì)100例》 《計(jì)算機(jī)立體美術(shù)設(shè)計(jì)3ds max實(shí)例教程》《Flash MX 2004網(wǎng)絡(luò)動(dòng)畫(huà)精彩實(shí)例創(chuàng)作通》
第1章 Pandas快速入門(mén) 1
1.1 初識(shí)Pandas 2
1.1.1 什么是Pandas 2
1.1.2 Pandas的主要數(shù)據(jù)結(jié)構(gòu) 2
1.1.3 Pandas的優(yōu)勢(shì) 2
1.2 Pandas開(kāi)發(fā)環(huán)境配置 3
1.2.1 Python概述 3
1.2.2 Anaconda概述 5
1.2.3 Anaconda的下載 5
1.2.4 Anaconda的安裝 8
1.2.5 Jupyter Notebook概述 11
1.3 Jupyter Notebook界面的基本操作 13
1.3.1 Jupyter Notebook的主界面 13
1.3.2 Jupyter Notebook的編輯頁(yè)面 14
1.3.3 Jupyter Notebook的文件操作 18
1.4 實(shí)例:第一個(gè)Pandas數(shù)據(jù)處理程序 20
第2章 Pandas常用的數(shù)據(jù)結(jié)構(gòu) 22
2.1 初識(shí)數(shù)據(jù)結(jié)構(gòu) 23
2.1.1 什么是數(shù)據(jù)及數(shù)據(jù)處理 23
2.1.2 什么是信息 23
2.1.3 什么是數(shù)據(jù)結(jié)構(gòu) 24
2.2 Python的數(shù)據(jù)結(jié)構(gòu) 24
2.2.1 數(shù)值型應(yīng)用實(shí)例 24
2.2.2 字符串型應(yīng)用實(shí)例 27
2.2.3 列表應(yīng)用實(shí)例 30
2.2.4 元組應(yīng)用實(shí)例 34
2.2.5 字典應(yīng)用實(shí)例 36
2.2.6 集合應(yīng)用實(shí)例 38
2.3 NumPy的數(shù)據(jù)結(jié)構(gòu) 40
2.3.1 NumPy數(shù)組的創(chuàng)建 41
2.3.2 NumPy特殊數(shù)組 42
2.3.3 NumPy序列數(shù)組 43
2.3.4 NumPy數(shù)組運(yùn)算 44
2.3.5 NumPy的矩陣 45
2.3.6 兩個(gè)數(shù)組的點(diǎn)積 46
2.3.7 兩個(gè)向量的點(diǎn)積 47
2.3.8 數(shù)組的向量?jī)?nèi)積 48
2.3.9 矩陣的行列式 49
2.3.10 矩陣的逆 50
2.4 Pandas的數(shù)據(jù)結(jié)構(gòu) 51
2.4.1 一維數(shù)組系列應(yīng)用實(shí)例 52
2.4.2 二維數(shù)組應(yīng)用實(shí)例 53
第3章 Pandas數(shù)據(jù)的導(dǎo)入與導(dǎo)出 55
3.1 導(dǎo)入CSV文件 56
3.1.1 CSV文件概述 56
3.1.2 創(chuàng)建CSV文件,并輸入內(nèi)容 56
3.1.3 read_csv()方法 58
3.1.4 利用read_csv()方法導(dǎo)入CSV文件實(shí)例 60
3.2 導(dǎo)入Excel文件 63
3.2.1 在Excel中輸入內(nèi)容并上傳 63
3.2.2 read_excel()方法 65
3.2.3 利用read_excel()方法導(dǎo)入Excel文件實(shí)例 66
3.3 導(dǎo)入JSON文件 68
3.3.1 創(chuàng)建JSON文件,并輸入內(nèi)容 68
3.3.2 read_json()方法 69
3.3.3 利用read_json()方法導(dǎo)入JSON文件實(shí)例 70
3.4 Pandas數(shù)據(jù)的輸出 70
3.4.1 輸出CSV文件 71
3.4.2 輸出Excel文件 73
3.4.3 輸出JSON文件 76
第4章 Pandas數(shù)據(jù)表的查看和清洗 79
4.1 Pandas數(shù)據(jù)表信息的查看 80
4.1.1 利用shape屬性查看數(shù)據(jù)表的維度 80
4.1.2 利用dtype和dtypes屬性查看列數(shù)據(jù)的類型 82
4.1.3 利用columns和values屬性查看表頭和數(shù)據(jù)表數(shù)據(jù)信息 84
4.1.4 利用isnull()方法查看空值信息 85
4.1.5 利用unique()方法查看列中的無(wú)重復(fù)數(shù)據(jù)信息 87
4.1.6 利用info()方法查看數(shù)據(jù)表的基本信息 88
4.1.7 利用head()方法查看數(shù)據(jù)表前幾行數(shù)據(jù) 89
4.1.8 利用tail()方法查看數(shù)據(jù)表后幾行數(shù)據(jù) 91
4.2 Pandas數(shù)據(jù)表的清洗 92
4.2.1 空值的清洗 92
4.2.2 格式錯(cuò)誤數(shù)據(jù)的清洗 97
4.2.3 錯(cuò)誤數(shù)據(jù)的清洗 98
4.2.4 重復(fù)數(shù)據(jù)的清洗 101
4.2.5 數(shù)據(jù)表列名的清洗 103
4.2.6 數(shù)據(jù)內(nèi)容的清洗 105
第5章 Pandas數(shù)據(jù)的合并與對(duì)比 108
5.1 利用append()方法追加數(shù)據(jù) 109
5.1.1 append()方法及參數(shù) 109
5.1.2 利用append()方法實(shí)現(xiàn)相同結(jié)構(gòu)數(shù)據(jù)表的數(shù)據(jù)追加 109
5.1.3 利用append()方法實(shí)現(xiàn)不同結(jié)構(gòu)數(shù)據(jù)表的數(shù)據(jù)追加 111
5.1.4 利用append()方法實(shí)現(xiàn)忽略索引的數(shù)據(jù)追加 113
5.1.5 追加Series序列 115
5.1.6 追加字典列表 117
5.2 利用concat()方法合并數(shù)據(jù) 118
5.2.1 concat()方法及參數(shù) 118
5.2.2 利用concat()方法縱向合并數(shù)據(jù) 119
5.2.3 利用concat()方法橫向合并數(shù)據(jù) 120
5.2.4 合并數(shù)據(jù)的交集 122
5.3 利用merge()方法合并數(shù)據(jù) 125
5.3.1 merge()方法及參數(shù) 125
5.3.2 利用merge()方法合并數(shù)據(jù)實(shí)例 126
5.4 利用compare()方法對(duì)比數(shù)據(jù) 130
5.4.1 compare()方法及參數(shù) 130
5.4.2 利用compare()方法對(duì)比數(shù)據(jù)實(shí)例 131
第6章 Pandas數(shù)據(jù)的預(yù)處理 135
6.1 設(shè)置索引列 135
6.1.1 Pandas索引的作用 136
6.1.2 set_index()方法及參數(shù) 136
6.1.3 利用set_index()方法設(shè)置索引列實(shí)例 137
6.1.4 利用reset_index()方法還原索引列實(shí)例 139
6.2 排序 141
6.2.1 按索引列排序 141
6.2.2 按指定列排序 144
6.3 分組標(biāo)記 146
6.3.1 利用where()方法添加分組標(biāo)記 146
6.3.2 根據(jù)多個(gè)條件進(jìn)行分組標(biāo)記 148
6.4 列的拆分 151
第7章 Pandas數(shù)據(jù)的提取 155
7.1 利用loc[ ]提取數(shù)據(jù) 155
7.1.1 利用loc[ ]提取整行數(shù)據(jù) 156
7.1.2 利用loc[ ]提取整列數(shù)據(jù) 158
7.1.3 利用loc[ ]提取具體數(shù)據(jù) 161
7.2 利用iloc[ ]提取數(shù)據(jù) 164
7.2.1 利用iloc[ ]提取整行數(shù)據(jù) 165
7.2.2 利用iloc[ ]提取整列數(shù)據(jù) 167
7.2.3 利用iloc[ ]提取具體數(shù)據(jù) 168
7.3 利用屬性提取數(shù)據(jù) 170
7.4 利用For循環(huán)提取數(shù)據(jù) 172
第8章 Pandas數(shù)據(jù)的篩選 175
8.1 Pandas數(shù)據(jù)關(guān)系篩選 176
8.1.1 等于關(guān)系數(shù)據(jù)篩選實(shí)例 176
8.1.2 不等于關(guān)系數(shù)據(jù)篩選實(shí)例 178
8.1.3 大于和大于等于關(guān)系數(shù)據(jù)篩選實(shí)例 180
8.1.4 小于和小于等于關(guān)系數(shù)據(jù)篩選實(shí)例 182
8.2 Pandas數(shù)據(jù)邏輯篩選 183
8.2.1 使用“與”進(jìn)行數(shù)據(jù)篩選實(shí)例 183
8.2.2 使用“或”進(jìn)行數(shù)據(jù)篩選實(shí)例 185
8.2.3 使用“非”進(jìn)行數(shù)據(jù)篩選實(shí)例 186
8.3 使用query()方法進(jìn)行數(shù)據(jù)篩選實(shí)例 188
8.4 使用filter()方法進(jìn)行數(shù)據(jù)篩選 192
8.4.1 filter()方法及意義 193
8.4.2 使用filter()方法進(jìn)行數(shù)據(jù)篩選實(shí)例 193
第9章 Pandas數(shù)據(jù)的聚合函數(shù) 197
9.1 sum()函數(shù)的應(yīng)用 197
9.1.1 sum()函數(shù)及參數(shù) 198
9.1.2 sum()函數(shù)應(yīng)用實(shí)例 198
9.2 mean()函數(shù)的應(yīng)用 202
9.2.1 mean()函數(shù)及參數(shù) 203
9.2.2 mean()函數(shù)應(yīng)用實(shí)例 203
9.3 max()函數(shù)的應(yīng)用 207
9.3.1 max()函數(shù)及參數(shù) 207
9.3.2 max()函數(shù)應(yīng)用實(shí)例 207
9.4 min()函數(shù)的應(yīng)用 210
9.4.1 min()函數(shù)及參數(shù) 210
9.4.2 min()函數(shù)應(yīng)用實(shí)例 211
9.5 count()函數(shù)的應(yīng)用 213
9.5.1 count()函數(shù)及參數(shù) 214
9.5.2 count()函數(shù)應(yīng)用實(shí)例 214
第10章 Pandas數(shù)據(jù)的分組與透視 217
10.1 Pandas數(shù)據(jù)的分組 218
10.1.1 groupby()方法及參數(shù) 218
10.1.2 groupby()方法的應(yīng)用 218
10.1.3 agg()方法的應(yīng)用 223
10.1.4 transform()方法的應(yīng)用 226
10.2 Pandas數(shù)據(jù)的透視 230
10.2.1 pivot_table()方法及參數(shù) 230
10.2.2 利用pivot_table()方法透視數(shù)據(jù)實(shí)例 231
10.2.3 crosstab()方法及參數(shù) 235
10.2.4 利用crosstab()方法透視數(shù)據(jù)實(shí)例 236
第11章 Pandas數(shù)據(jù)的統(tǒng)計(jì) 243
11.1 數(shù)據(jù)采樣 243
11.1.1 sample()方法及參數(shù) 244
11.1.2 利用sample()方法進(jìn)行數(shù)據(jù)采樣實(shí)例 244
11.2 數(shù)據(jù)統(tǒng)計(jì) 249
11.2.1 數(shù)據(jù)表描述性統(tǒng)計(jì) 249
11.2.2 利用describe()方法進(jìn)行數(shù)據(jù)表描述性統(tǒng)計(jì)實(shí)例 250
11.2.3 中位數(shù)的應(yīng)用 255
11.2.4 方差的應(yīng)用 260
11.2.5 標(biāo)準(zhǔn)差的應(yīng)用 263
11.3 數(shù)據(jù)相關(guān)性分析 267
11.3.1 協(xié)方差的應(yīng)用 267
11.3.2 協(xié)方差相關(guān)系數(shù)的應(yīng)用 270
第12章 Pandas數(shù)據(jù)的可視化 275
12.1 利用Pandas中的plot()方法繪圖 276
12.1.1 plot()方法及參數(shù) 276
12.1.2 繪制折線圖實(shí)例 277
12.1.3 繪制條形圖實(shí)例 279
12.1.4 利用plot()方法繪制其他類型圖形實(shí)例 283
12.2 利用Matplotlib包繪制Pandas數(shù)據(jù)圖形 287
12.2.1 figure()方法的應(yīng)用實(shí)例 288
12.2.2 plot()方法的應(yīng)用實(shí)例 290
12.2.3 subplot()方法的應(yīng)用實(shí)例 294
12.2.4 add_axes()方法的應(yīng)用實(shí)例 296
12.2.5 legend()方法的應(yīng)用實(shí)例 298
12.2.6 設(shè)置線條的寬度和顏色實(shí)例 300
12.2.7 添加坐標(biāo)軸網(wǎng)格線實(shí)例 302
第13章 Pandas數(shù)據(jù)的機(jī)器學(xué)習(xí)算法 303
13.1 機(jī)器學(xué)習(xí)概述 304
13.1.1 什么是機(jī)器學(xué)習(xí) 304
13.1.2 機(jī)器學(xué)習(xí)的類型 304
13.2 常見(jiàn)的機(jī)器學(xué)習(xí)算法 305
13.3 機(jī)器學(xué)習(xí)的sklearn包 307
13.3.1 sklearn包中的數(shù)據(jù)集 308
13.3.2 iris數(shù)據(jù)集 308
13.3.3 查看iris數(shù)據(jù)集實(shí)例 309
13.4 決策樹(shù) 314
13.4.1 決策樹(shù)的組成 315
13.4.2 決策樹(shù)的優(yōu)點(diǎn) 315
13.4.3 決策樹(shù)的缺點(diǎn) 316
13.4.4 決策樹(shù)實(shí)現(xiàn)實(shí)例 316
13.5 隨機(jī)森林 318
13.5.1 隨機(jī)森林的構(gòu)建 318
13.5.2 隨機(jī)森林的優(yōu)缺點(diǎn) 318
13.5.3 隨機(jī)森林的應(yīng)用范圍 319
13.5.4 隨機(jī)森林實(shí)現(xiàn)實(shí)例 319
13.6 支持向量機(jī) 321
13.6.1 支持向量機(jī)的工作原理 321
13.6.2 核函數(shù) 322
13.6.3 支持向量機(jī)的優(yōu)點(diǎn) 324
13.6.4 支持向量機(jī)的缺點(diǎn) 324
13.6.5 支持向量機(jī)實(shí)現(xiàn)實(shí)例 325
13.7 樸素貝葉斯算法 328
13.7.1 樸素貝葉斯算法的思想 329
13.7.2 樸素貝葉斯算法的步驟 329
13.7.3 樸素貝葉斯算法的優(yōu)缺點(diǎn) 330
13.7.4 高斯樸素貝葉斯模型實(shí)現(xiàn)實(shí)例 330
13.7.5 多項(xiàng)式分布樸素貝葉斯模型實(shí)現(xiàn)實(shí)例 333
13.7.6 伯努力樸素貝葉斯模型實(shí)現(xiàn)實(shí)例 336
第14章 Pandas的時(shí)間序列數(shù)據(jù) 338
14.1 Pandas時(shí)間序列的創(chuàng)建 339
14.1.1 date_range()方法及參數(shù) 339
14.1.2 利用date_range()方法創(chuàng)建時(shí)間序列實(shí)例 340
14.1.3 時(shí)間戳對(duì)象 341
14.2 時(shí)間類型與字符串類型的轉(zhuǎn)換 343
14.3 時(shí)間序列數(shù)據(jù)的操作技巧 345
14.3.1 時(shí)間序列數(shù)據(jù)的提取 345
14.3.2 時(shí)間序列數(shù)據(jù)的篩選 349
14.3.3 時(shí)間序列數(shù)據(jù)的重采樣 352
14.3.4 時(shí)間序列數(shù)據(jù)的滑動(dòng)窗口 355
14.4 時(shí)間序列數(shù)據(jù)的預(yù)測(cè) 359
14.4.1 時(shí)間序列數(shù)據(jù)的準(zhǔn)備 359
14.4.2 時(shí)間序列數(shù)據(jù)的樸素預(yù)測(cè)法 362
14.4.3 時(shí)間序列數(shù)據(jù)的簡(jiǎn)單平均預(yù)測(cè)法 363
14.4.4 時(shí)間序列數(shù)據(jù)的移動(dòng)平均預(yù)測(cè)法 365
14.4.5 時(shí)間序列數(shù)據(jù)的簡(jiǎn)單指數(shù)平滑預(yù)測(cè)法 367
14.4.6 時(shí)間序列數(shù)據(jù)的霍爾特線性趨勢(shì)預(yù)測(cè)法 369
14.4.7 時(shí)間序列數(shù)據(jù)的Holt-Winters季節(jié)性預(yù)測(cè)法 371
14.4.8 時(shí)間序列數(shù)據(jù)的自回歸移動(dòng)平均預(yù)測(cè)法 373