![]() ![]() |
Pandas入門與實(shí)戰(zhàn)應(yīng)用 :基于Python的數(shù)據(jù)分析與處理 讀者對(duì)象:主要面向互聯(lián)網(wǎng)從業(yè)人員包括數(shù)據(jù)分析師、產(chǎn)品經(jīng)理、運(yùn)營(yíng)、開(kāi)發(fā)等人員,在其他行業(yè)如金融、教育、通訊、文化傳媒等行業(yè)與數(shù)據(jù)密切的相關(guān)人員也是目標(biāo)對(duì)象。 ![]()
本書(shū)首先講解Pandas快速入門的基礎(chǔ)知識(shí),如Pandas的定義、可處理的數(shù)據(jù)類型、優(yōu)勢(shì)、開(kāi)發(fā)環(huán)境配置、常用的數(shù)據(jù)結(jié)構(gòu)等;然后通過(guò)實(shí)例剖析講解Pandas數(shù)據(jù)的導(dǎo)入、導(dǎo)出、查看、清洗、合并、對(duì)比、預(yù)處理;接著講解Pandas數(shù)據(jù)的提取、篩選、匯總、統(tǒng)計(jì)及可視化;然后講解Pandas數(shù)據(jù)的線性模型和廣義線性模型,最后講解Pandas數(shù)據(jù)實(shí)戰(zhàn)分析。在講解過(guò)程中即考慮讀者的學(xué)習(xí)習(xí)慣,又通過(guò)具體實(shí)例剖析講解Pandas實(shí)戰(zhàn)應(yīng)用中的熱點(diǎn)問(wèn)題、關(guān)鍵問(wèn)題及種種難題。
周峰,畢業(yè)于青島海洋大學(xué)計(jì)算機(jī)科學(xué)與應(yīng)用專業(yè)。曾先后就職于青島商業(yè)中專和青島遠(yuǎn)洋學(xué)院計(jì)算機(jī)系,從事計(jì)算機(jī)輔助設(shè)計(jì)的教學(xué)與研究。曾出版作品如下:《C語(yǔ)言實(shí)用程序設(shè)計(jì)100例》 《VB控件實(shí)用程序設(shè)計(jì)100例》 《計(jì)算機(jī)立體美術(shù)設(shè)計(jì)3ds max實(shí)例教程》《Flash MX 2004網(wǎng)絡(luò)動(dòng)畫精彩實(shí)例創(chuàng)作通》
第1章 Pandas快速入門 1
1.1 初識(shí)Pandas 2 1.1.1 什么是Pandas 2 1.1.2 Pandas的主要數(shù)據(jù)結(jié)構(gòu) 2 1.1.3 Pandas的優(yōu)勢(shì) 2 1.2 Pandas開(kāi)發(fā)環(huán)境配置 3 1.2.1 Python概述 3 1.2.2 Anaconda概述 5 1.2.3 Anaconda的下載 5 1.2.4 Anaconda的安裝 8 1.2.5 Jupyter Notebook概述 11 1.3 Jupyter Notebook界面的基本操作 13 1.3.1 Jupyter Notebook的主界面 13 1.3.2 Jupyter Notebook的編輯頁(yè)面 14 1.3.3 Jupyter Notebook的文件操作 18 1.4 實(shí)例:第一個(gè)Pandas數(shù)據(jù)處理程序 20 第2章 Pandas常用的數(shù)據(jù)結(jié)構(gòu) 22 2.1 初識(shí)數(shù)據(jù)結(jié)構(gòu) 23 2.1.1 什么是數(shù)據(jù)及數(shù)據(jù)處理 23 2.1.2 什么是信息 23 2.1.3 什么是數(shù)據(jù)結(jié)構(gòu) 24 2.2 Python的數(shù)據(jù)結(jié)構(gòu) 24 2.2.1 數(shù)值型應(yīng)用實(shí)例 24 2.2.2 字符串型應(yīng)用實(shí)例 27 2.2.3 列表應(yīng)用實(shí)例 30 2.2.4 元組應(yīng)用實(shí)例 34 2.2.5 字典應(yīng)用實(shí)例 36 2.2.6 集合應(yīng)用實(shí)例 38 2.3 NumPy的數(shù)據(jù)結(jié)構(gòu) 40 2.3.1 NumPy數(shù)組的創(chuàng)建 41 2.3.2 NumPy特殊數(shù)組 42 2.3.3 NumPy序列數(shù)組 43 2.3.4 NumPy數(shù)組運(yùn)算 44 2.3.5 NumPy的矩陣 45 2.3.6 兩個(gè)數(shù)組的點(diǎn)積 46 2.3.7 兩個(gè)向量的點(diǎn)積 47 2.3.8 數(shù)組的向量?jī)?nèi)積 48 2.3.9 矩陣的行列式 49 2.3.10 矩陣的逆 50 2.4 Pandas的數(shù)據(jù)結(jié)構(gòu) 51 2.4.1 一維數(shù)組系列應(yīng)用實(shí)例 52 2.4.2 二維數(shù)組應(yīng)用實(shí)例 53 第3章 Pandas數(shù)據(jù)的導(dǎo)入與導(dǎo)出 55 3.1 導(dǎo)入CSV文件 56 3.1.1 CSV文件概述 56 3.1.2 創(chuàng)建CSV文件,并輸入內(nèi)容 56 3.1.3 read_csv()方法 58 3.1.4 利用read_csv()方法導(dǎo)入CSV文件實(shí)例 60 3.2 導(dǎo)入Excel文件 63 3.2.1 在Excel中輸入內(nèi)容并上傳 63 3.2.2 read_excel()方法 65 3.2.3 利用read_excel()方法導(dǎo)入Excel文件實(shí)例 66 3.3 導(dǎo)入JSON文件 68 3.3.1 創(chuàng)建JSON文件,并輸入內(nèi)容 68 3.3.2 read_json()方法 69 3.3.3 利用read_json()方法導(dǎo)入JSON文件實(shí)例 70 3.4 Pandas數(shù)據(jù)的輸出 70 3.4.1 輸出CSV文件 71 3.4.2 輸出Excel文件 73 3.4.3 輸出JSON文件 76 第4章 Pandas數(shù)據(jù)表的查看和清洗 79 4.1 Pandas數(shù)據(jù)表信息的查看 80 4.1.1 利用shape屬性查看數(shù)據(jù)表的維度 80 4.1.2 利用dtype和dtypes屬性查看列數(shù)據(jù)的類型 82 4.1.3 利用columns和values屬性查看表頭和數(shù)據(jù)表數(shù)據(jù)信息 84 4.1.4 利用isnull()方法查看空值信息 85 4.1.5 利用unique()方法查看列中的無(wú)重復(fù)數(shù)據(jù)信息 87 4.1.6 利用info()方法查看數(shù)據(jù)表的基本信息 88 4.1.7 利用head()方法查看數(shù)據(jù)表前幾行數(shù)據(jù) 89 4.1.8 利用tail()方法查看數(shù)據(jù)表后幾行數(shù)據(jù) 91 4.2 Pandas數(shù)據(jù)表的清洗 92 4.2.1 空值的清洗 92 4.2.2 格式錯(cuò)誤數(shù)據(jù)的清洗 97 4.2.3 錯(cuò)誤數(shù)據(jù)的清洗 98 4.2.4 重復(fù)數(shù)據(jù)的清洗 101 4.2.5 數(shù)據(jù)表列名的清洗 103 4.2.6 數(shù)據(jù)內(nèi)容的清洗 105 第5章 Pandas數(shù)據(jù)的合并與對(duì)比 108 5.1 利用append()方法追加數(shù)據(jù) 109 5.1.1 append()方法及參數(shù) 109 5.1.2 利用append()方法實(shí)現(xiàn)相同結(jié)構(gòu)數(shù)據(jù)表的數(shù)據(jù)追加 109 5.1.3 利用append()方法實(shí)現(xiàn)不同結(jié)構(gòu)數(shù)據(jù)表的數(shù)據(jù)追加 111 5.1.4 利用append()方法實(shí)現(xiàn)忽略索引的數(shù)據(jù)追加 113 5.1.5 追加Series序列 115 5.1.6 追加字典列表 117 5.2 利用concat()方法合并數(shù)據(jù) 118 5.2.1 concat()方法及參數(shù) 118 5.2.2 利用concat()方法縱向合并數(shù)據(jù) 119 5.2.3 利用concat()方法橫向合并數(shù)據(jù) 120 5.2.4 合并數(shù)據(jù)的交集 122 5.3 利用merge()方法合并數(shù)據(jù) 125 5.3.1 merge()方法及參數(shù) 125 5.3.2 利用merge()方法合并數(shù)據(jù)實(shí)例 126 5.4 利用compare()方法對(duì)比數(shù)據(jù) 130 5.4.1 compare()方法及參數(shù) 130 5.4.2 利用compare()方法對(duì)比數(shù)據(jù)實(shí)例 131 第6章 Pandas數(shù)據(jù)的預(yù)處理 135 6.1 設(shè)置索引列 135 6.1.1 Pandas索引的作用 136 6.1.2 set_index()方法及參數(shù) 136 6.1.3 利用set_index()方法設(shè)置索引列實(shí)例 137 6.1.4 利用reset_index()方法還原索引列實(shí)例 139 6.2 排序 141 6.2.1 按索引列排序 141 6.2.2 按指定列排序 144 6.3 分組標(biāo)記 146 6.3.1 利用where()方法添加分組標(biāo)記 146 6.3.2 根據(jù)多個(gè)條件進(jìn)行分組標(biāo)記 148 6.4 列的拆分 151 第7章 Pandas數(shù)據(jù)的提取 155 7.1 利用loc[ ]提取數(shù)據(jù) 155 7.1.1 利用loc[ ]提取整行數(shù)據(jù) 156 7.1.2 利用loc[ ]提取整列數(shù)據(jù) 158 7.1.3 利用loc[ ]提取具體數(shù)據(jù) 161 7.2 利用iloc[ ]提取數(shù)據(jù) 164 7.2.1 利用iloc[ ]提取整行數(shù)據(jù) 165 7.2.2 利用iloc[ ]提取整列數(shù)據(jù) 167 7.2.3 利用iloc[ ]提取具體數(shù)據(jù) 168 7.3 利用屬性提取數(shù)據(jù) 170 7.4 利用For循環(huán)提取數(shù)據(jù) 172 第8章 Pandas數(shù)據(jù)的篩選 175 8.1 Pandas數(shù)據(jù)關(guān)系篩選 176 8.1.1 等于關(guān)系數(shù)據(jù)篩選實(shí)例 176 8.1.2 不等于關(guān)系數(shù)據(jù)篩選實(shí)例 178 8.1.3 大于和大于等于關(guān)系數(shù)據(jù)篩選實(shí)例 180 8.1.4 小于和小于等于關(guān)系數(shù)據(jù)篩選實(shí)例 182 8.2 Pandas數(shù)據(jù)邏輯篩選 183 8.2.1 使用“與”進(jìn)行數(shù)據(jù)篩選實(shí)例 183 8.2.2 使用“或”進(jìn)行數(shù)據(jù)篩選實(shí)例 185 8.2.3 使用“非”進(jìn)行數(shù)據(jù)篩選實(shí)例 186 8.3 使用query()方法進(jìn)行數(shù)據(jù)篩選實(shí)例 188 8.4 使用filter()方法進(jìn)行數(shù)據(jù)篩選 192 8.4.1 filter()方法及意義 193 8.4.2 使用filter()方法進(jìn)行數(shù)據(jù)篩選實(shí)例 193 第9章 Pandas數(shù)據(jù)的聚合函數(shù) 197 9.1 sum()函數(shù)的應(yīng)用 197 9.1.1 sum()函數(shù)及參數(shù) 198 9.1.2 sum()函數(shù)應(yīng)用實(shí)例 198 9.2 mean()函數(shù)的應(yīng)用 202 9.2.1 mean()函數(shù)及參數(shù) 203 9.2.2 mean()函數(shù)應(yīng)用實(shí)例 203 9.3 max()函數(shù)的應(yīng)用 207 9.3.1 max()函數(shù)及參數(shù) 207 9.3.2 max()函數(shù)應(yīng)用實(shí)例 207 9.4 min()函數(shù)的應(yīng)用 210 9.4.1 min()函數(shù)及參數(shù) 210 9.4.2 min()函數(shù)應(yīng)用實(shí)例 211 9.5 count()函數(shù)的應(yīng)用 213 9.5.1 count()函數(shù)及參數(shù) 214 9.5.2 count()函數(shù)應(yīng)用實(shí)例 214 第10章 Pandas數(shù)據(jù)的分組與透視 217 10.1 Pandas數(shù)據(jù)的分組 218 10.1.1 groupby()方法及參數(shù) 218 10.1.2 groupby()方法的應(yīng)用 218 10.1.3 agg()方法的應(yīng)用 223 10.1.4 transform()方法的應(yīng)用 226 10.2 Pandas數(shù)據(jù)的透視 230 10.2.1 pivot_table()方法及參數(shù) 230 10.2.2 利用pivot_table()方法透視數(shù)據(jù)實(shí)例 231 10.2.3 crosstab()方法及參數(shù) 235 10.2.4 利用crosstab()方法透視數(shù)據(jù)實(shí)例 236 第11章 Pandas數(shù)據(jù)的統(tǒng)計(jì) 243 11.1 數(shù)據(jù)采樣 243 11.1.1 sample()方法及參數(shù) 244 11.1.2 利用sample()方法進(jìn)行數(shù)據(jù)采樣實(shí)例 244 11.2 數(shù)據(jù)統(tǒng)計(jì) 249 11.2.1 數(shù)據(jù)表描述性統(tǒng)計(jì) 249 11.2.2 利用describe()方法進(jìn)行數(shù)據(jù)表描述性統(tǒng)計(jì)實(shí)例 250 11.2.3 中位數(shù)的應(yīng)用 255 11.2.4 方差的應(yīng)用 260 11.2.5 標(biāo)準(zhǔn)差的應(yīng)用 263 11.3 數(shù)據(jù)相關(guān)性分析 267 11.3.1 協(xié)方差的應(yīng)用 267 11.3.2 協(xié)方差相關(guān)系數(shù)的應(yīng)用 270 第12章 Pandas數(shù)據(jù)的可視化 275 12.1 利用Pandas中的plot()方法繪圖 276 12.1.1 plot()方法及參數(shù) 276 12.1.2 繪制折線圖實(shí)例 277 12.1.3 繪制條形圖實(shí)例 279 12.1.4 利用plot()方法繪制其他類型圖形實(shí)例 283 12.2 利用Matplotlib包繪制Pandas數(shù)據(jù)圖形 287 12.2.1 figure()方法的應(yīng)用實(shí)例 288 12.2.2 plot()方法的應(yīng)用實(shí)例 290 12.2.3 subplot()方法的應(yīng)用實(shí)例 294 12.2.4 add_axes()方法的應(yīng)用實(shí)例 296 12.2.5 legend()方法的應(yīng)用實(shí)例 298 12.2.6 設(shè)置線條的寬度和顏色實(shí)例 300 12.2.7 添加坐標(biāo)軸網(wǎng)格線實(shí)例 302 第13章 Pandas數(shù)據(jù)的機(jī)器學(xué)習(xí)算法 303 13.1 機(jī)器學(xué)習(xí)概述 304 13.1.1 什么是機(jī)器學(xué)習(xí) 304 13.1.2 機(jī)器學(xué)習(xí)的類型 304 13.2 常見(jiàn)的機(jī)器學(xué)習(xí)算法 305 13.3 機(jī)器學(xué)習(xí)的sklearn包 307 13.3.1 sklearn包中的數(shù)據(jù)集 308 13.3.2 iris數(shù)據(jù)集 308 13.3.3 查看iris數(shù)據(jù)集實(shí)例 309 13.4 決策樹(shù) 314 13.4.1 決策樹(shù)的組成 315 13.4.2 決策樹(shù)的優(yōu)點(diǎn) 315 13.4.3 決策樹(shù)的缺點(diǎn) 316 13.4.4 決策樹(shù)實(shí)現(xiàn)實(shí)例 316 13.5 隨機(jī)森林 318 13.5.1 隨機(jī)森林的構(gòu)建 318 13.5.2 隨機(jī)森林的優(yōu)缺點(diǎn) 318 13.5.3 隨機(jī)森林的應(yīng)用范圍 319 13.5.4 隨機(jī)森林實(shí)現(xiàn)實(shí)例 319 13.6 支持向量機(jī) 321 13.6.1 支持向量機(jī)的工作原理 321 13.6.2 核函數(shù) 322 13.6.3 支持向量機(jī)的優(yōu)點(diǎn) 324 13.6.4 支持向量機(jī)的缺點(diǎn) 324 13.6.5 支持向量機(jī)實(shí)現(xiàn)實(shí)例 325 13.7 樸素貝葉斯算法 328 13.7.1 樸素貝葉斯算法的思想 329 13.7.2 樸素貝葉斯算法的步驟 329 13.7.3 樸素貝葉斯算法的優(yōu)缺點(diǎn) 330 13.7.4 高斯樸素貝葉斯模型實(shí)現(xiàn)實(shí)例 330 13.7.5 多項(xiàng)式分布樸素貝葉斯模型實(shí)現(xiàn)實(shí)例 333 13.7.6 伯努力樸素貝葉斯模型實(shí)現(xiàn)實(shí)例 336 第14章 Pandas的時(shí)間序列數(shù)據(jù) 338 14.1 Pandas時(shí)間序列的創(chuàng)建 339 14.1.1 date_range()方法及參數(shù) 339 14.1.2 利用date_range()方法創(chuàng)建時(shí)間序列實(shí)例 340 14.1.3 時(shí)間戳對(duì)象 341 14.2 時(shí)間類型與字符串類型的轉(zhuǎn)換 343 14.3 時(shí)間序列數(shù)據(jù)的操作技巧 345 14.3.1 時(shí)間序列數(shù)據(jù)的提取 345 14.3.2 時(shí)間序列數(shù)據(jù)的篩選 349 14.3.3 時(shí)間序列數(shù)據(jù)的重采樣 352 14.3.4 時(shí)間序列數(shù)據(jù)的滑動(dòng)窗口 355 14.4 時(shí)間序列數(shù)據(jù)的預(yù)測(cè) 359 14.4.1 時(shí)間序列數(shù)據(jù)的準(zhǔn)備 359 14.4.2 時(shí)間序列數(shù)據(jù)的樸素預(yù)測(cè)法 362 14.4.3 時(shí)間序列數(shù)據(jù)的簡(jiǎn)單平均預(yù)測(cè)法 363 14.4.4 時(shí)間序列數(shù)據(jù)的移動(dòng)平均預(yù)測(cè)法 365 14.4.5 時(shí)間序列數(shù)據(jù)的簡(jiǎn)單指數(shù)平滑預(yù)測(cè)法 367 14.4.6 時(shí)間序列數(shù)據(jù)的霍爾特線性趨勢(shì)預(yù)測(cè)法 369 14.4.7 時(shí)間序列數(shù)據(jù)的Holt-Winters季節(jié)性預(yù)測(cè)法 371 14.4.8 時(shí)間序列數(shù)據(jù)的自回歸移動(dòng)平均預(yù)測(cè)法 373
你還可能感興趣
我要評(píng)論
|