普通高等院校應(yīng)用型人才培養(yǎng)“十三五”規(guī)劃教材:Python數(shù)據(jù)分析
定 價(jià):45 元
叢書(shū)名:普通高等院校應(yīng)用型人才培養(yǎng)“十三五”規(guī)劃教材
- 作者:[中國(guó)]吳道君;朱家榮
- 出版時(shí)間:2019/9/1
- ISBN:9787113258719
- 出 版 社:中國(guó)鐵道出版社
- 中圖法分類(lèi):TP311.561
- 頁(yè)碼:
- 紙張:膠版紙
- 版次:
- 開(kāi)本:16開(kāi)
本書(shū)全面講解Python數(shù)據(jù)分析的相關(guān)知識(shí)和技術(shù),內(nèi)容包括Python數(shù)據(jù)分析概述、NumPy數(shù)值計(jì)算、Matplotlib數(shù)據(jù)可視化、Pandas數(shù)據(jù)分析、數(shù)據(jù)預(yù)處理、Sklearn機(jī)器學(xué)習(xí)。本書(shū)以培養(yǎng)學(xué)生編程能力和數(shù)據(jù)分析能力為目標(biāo),注重技術(shù)應(yīng)用能力的培養(yǎng)。本書(shū)內(nèi)容充實(shí)、結(jié)構(gòu)合理、實(shí)用性強(qiáng),具有明確的應(yīng)用能力培養(yǎng)目標(biāo),易于接受和理解,學(xué)完本書(shū)后,可以具備數(shù)據(jù)分析的基本能力。本書(shū)適合作為普通高等院校人工智能、數(shù)據(jù)科學(xué)與大數(shù)據(jù)以及計(jì)算機(jī)相關(guān)專(zhuān)業(yè)課程的教材,也可以作為相關(guān)從業(yè)人員的技術(shù)參考用書(shū)。
微課版,本書(shū)重視技術(shù)應(yīng)用和實(shí)踐教學(xué),以眾多示例形象展示應(yīng)用,以實(shí)驗(yàn)操作提升學(xué)生能力。
數(shù)據(jù)的價(jià)值越來(lái)越被公眾認(rèn)可和推崇,而數(shù)據(jù)分析的作用就是通過(guò)一定的方法找出數(shù)據(jù)的價(jià)值。近年來(lái),隨著大數(shù)據(jù)技術(shù)和人工智能技術(shù)的發(fā)展,Python已經(jīng)成為數(shù)據(jù)科學(xué)領(lǐng)域重要的語(yǔ)言和工具。Python是一種面向?qū)ο、解釋型的?jì)算機(jī)程序設(shè)計(jì)語(yǔ)言,其語(yǔ)法簡(jiǎn)潔清晰、成熟穩(wěn)定。Python重要的是具有豐富和強(qiáng)大的庫(kù),例如在數(shù)據(jù)分析領(lǐng)域的NumPy、Matplotlib、Pandas和Sklean等,這些庫(kù)基本上包含了數(shù)據(jù)分析的所有方面,為數(shù)據(jù)分析提供了強(qiáng)大的功能支持。有了這些數(shù)據(jù)分析庫(kù),就可以非常容易地對(duì)數(shù)據(jù)進(jìn)行分析,不再需要從基礎(chǔ)做起,大大降低了數(shù)據(jù)分析的難度和復(fù)雜度。本書(shū)主要講解使用Python以及Python的庫(kù)進(jìn)行數(shù)據(jù)分析的技術(shù),全書(shū)共分為6章,主要內(nèi)容如下:第1章Python數(shù)據(jù)分析概述,主要講解數(shù)據(jù)分析的相關(guān)概念及其應(yīng)用、Python在數(shù)據(jù)分析領(lǐng)域的優(yōu)勢(shì)、Python數(shù)據(jù)分析的第三方類(lèi)庫(kù)、Python數(shù)據(jù)分析環(huán)境庫(kù)的安裝、Jupyter Notebook工具的基本使用。第2章NumPy數(shù)值計(jì)算,主要講解NumPy數(shù)組的概念,NumPy數(shù)組的創(chuàng)建方法、屬性和數(shù)據(jù)類(lèi)型,常用數(shù)組操作方法的使用,數(shù)組的切片和索引方法,數(shù)組的各類(lèi)運(yùn)算方法和使用,NumPy的線性代數(shù)運(yùn)算函數(shù),數(shù)組的存取操作方法。第3章Matplotlib數(shù)據(jù)可視化,主要講解線形圖的繪制,線形圖的線的顏色、線型、坐標(biāo)點(diǎn)、線寬設(shè)置;散點(diǎn)圖、柱狀圖、條形圖、餅圖、直方圖、箱線圖的繪制;圖例、坐標(biāo)網(wǎng)格、坐標(biāo)系、樣式的設(shè)置,樣式、RC設(shè)置和文本注解;子圖的繪制、子圖坐標(biāo)系的設(shè)置、圖形嵌套;三維圖形的繪制。第4章Pandas數(shù)據(jù)分析,主要講解Pandas的數(shù)據(jù)結(jié)構(gòu),常用的DataFrame數(shù)據(jù)結(jié)構(gòu);DataFrame的基本功能,DataFrame的行操作與列操作;Pandas操作外部數(shù)據(jù)的方法,讀取CVS、數(shù)據(jù)庫(kù)數(shù)據(jù)的方法;DataFrame的重建索引、更換索引和層次化索引的使用;Series、DataFrame的數(shù)據(jù)運(yùn)算,函數(shù)應(yīng)用與映射、排序、迭代方法;描述性統(tǒng)計(jì)函數(shù),協(xié)方差、相關(guān)性等的計(jì)算方法;分組與聚合的概念、分組聚合的方法使用;透視表、交叉表的方法。第5章數(shù)據(jù)預(yù)處理,主要講解數(shù)據(jù)清洗的概念和方法,重復(fù)值、缺失值和異常值的檢測(cè)與處理;DataFrame對(duì)象的合并連接與重塑方法;數(shù)據(jù)變換的種類(lèi)、常用的數(shù)據(jù)變換方法。第6章Sklearn機(jī)器學(xué)習(xí),主要講解機(jī)器學(xué)習(xí)的有關(guān)概念,Sklearn數(shù)據(jù)集,Sklearn數(shù)據(jù)預(yù)處理,降維、回歸、聚類(lèi)和分類(lèi)算法,模型的選擇、訓(xùn)練、預(yù)測(cè)和評(píng)估等。本書(shū)配有完善的教學(xué)資源,包括教學(xué)課件、電子教案、教學(xué)大綱、教學(xué)計(jì)劃、實(shí)驗(yàn)參考、習(xí)題答案等,可以在http://www.tdpress.com/51eds中下載。在教學(xué)過(guò)程中如果遇到任何問(wèn)題,可以通過(guò)電子郵箱qingxiwang1111@163.com與作者進(jìn)行交流。本書(shū)由廣東嶺南職業(yè)技術(shù)學(xué)院吳道君、廣西民族師范學(xué)院朱家榮任主編,信陽(yáng)學(xué)院毛鳳翔、洛陽(yáng)師范學(xué)院郭洪濤、哈爾濱華務(wù)學(xué)院宋毅和孫海龍任副主編,其中宋毅編寫(xiě)了第1章, 吳道君編寫(xiě)了第2章,朱家榮編寫(xiě)了第3章,毛鳳翔編寫(xiě)了第4章,孫海龍編寫(xiě)了第5章,郭洪濤編寫(xiě)了第6章。全書(shū)由王慶喜主審。本書(shū)得到相關(guān)領(lǐng)導(dǎo)、同事和有關(guān)學(xué)生的熱情幫助和支持,在此向他們表示衷心的感謝。由于時(shí)間倉(cāng)促,編者水平有限,書(shū)中難免存在疏漏和不足之處,敬請(qǐng)讀者批評(píng)指正。編 者 2019年5月
吳道君,男,廣東嶺南職業(yè)技術(shù)學(xué)院講師、高級(jí)軟件工程師,承擔(dān)編程基礎(chǔ)C++、軟件工程、J2EE編程開(kāi)發(fā)、.net開(kāi)發(fā)等多門(mén)課程的教學(xué)任務(wù)。2011年12月指導(dǎo)學(xué)生參加第二屆“國(guó)信藍(lán)點(diǎn)杯”全國(guó)軟件專(zhuān)業(yè)人才設(shè)計(jì)與開(kāi)發(fā)大賽并獲得個(gè)人賽全國(guó)總決賽“二等獎(jiǎng)”,2013年在廣東省首屆信息技術(shù)類(lèi)專(zhuān)業(yè)帶頭人“說(shuō)專(zhuān)業(yè)”競(jìng)賽中獲得“二等獎(jiǎng)”。主編2016年9月于我社出版的《Java程序設(shè)計(jì)》一書(shū)。朱家榮:本科,就職于廣西師范大學(xué),從事數(shù)學(xué)、計(jì)算機(jī)等學(xué)科的課程教學(xué),近10年主要擔(dān)任《現(xiàn)代教育技術(shù)》、《教育技術(shù)與多媒體課件制作(含微課制作)》、《計(jì)算機(jī)應(yīng)用基礎(chǔ)》等課程教學(xué)。主持(或主要參與)完成廣西教育廳科研項(xiàng)目,廣西教育廳新世紀(jì)教改革工程項(xiàng)目等10多項(xiàng),發(fā)表學(xué)術(shù)論文20多篇、主編參編教材多部,參與的《競(jìng)賽驅(qū)動(dòng) 雙向融通 地方高師院校師范生教師職業(yè)能力提升的研究與實(shí)踐》項(xiàng)目獲2017年廣西高等教育自治區(qū)級(jí)教學(xué)成果獎(jiǎng)一等獎(jiǎng)。
第1章 Python數(shù)據(jù)分析概述 11.1 數(shù)據(jù)分析的概念、流程和應(yīng)用 11.1.1 數(shù)據(jù)分析的概念 11.1.2 數(shù)據(jù)分析的流程 21.1.3 數(shù)據(jù)分析的應(yīng)用 21.2 數(shù)據(jù)分析工具 31.2.1 常用工具 41.2.2 Python數(shù)據(jù)分析 41.3 Python數(shù)據(jù)分析環(huán)境 5小結(jié) 9習(xí)題 9實(shí)驗(yàn) 10第2章 NumPy數(shù)值計(jì)算 152.1 NumPy多維數(shù)組 152.1.1 數(shù)組創(chuàng)建 152.1.2 數(shù)組對(duì)象屬性 222.1.3 數(shù)組數(shù)據(jù)類(lèi)型 232.2 數(shù)組操作 242.2.1 修改數(shù)組形狀 242.2.2 翻轉(zhuǎn)數(shù)組 262.2.3 連接數(shù)組 272.2.4 分割數(shù)組 282.2.5 數(shù)組元素添加與刪除 302.3 數(shù)組索引與切片 322.3.1 數(shù)組索引 322.3.2 數(shù)組切片 332.3.3 布爾型索引 342.3.4 花式索引 352.4 數(shù)組的運(yùn)算 352.4.1 數(shù)組和標(biāo)量間的運(yùn)算 352.4.2 廣播 362.4.3 算術(shù)函數(shù) 372.4.4 集合運(yùn)算 402.4.5 統(tǒng)計(jì)運(yùn)算 412.4.6 排序 432.4.7 搜索 442.5 線性代數(shù) 452.5.1 數(shù)組相乘 462.5.2 矩陣行列式 462.5.3 逆矩陣 462.5.4 線性方程組 472.5.5 特征值和特征向量 472.6 數(shù)組的存取 48小結(jié) 48習(xí)題 48實(shí)驗(yàn) 51第3章 Matplotlib數(shù)據(jù)可視化 543.1 線形圖 543.1.1 繪制線形圖 543.1.2 顏色設(shè)置 553.1.3 線型設(shè)置 563.1.4 坐標(biāo)點(diǎn)設(shè)置 573.1.5 線寬設(shè)置 593.2 其他圖形 593.2.1 散點(diǎn)圖 593.2.2 柱形圖 613.2.3 條形圖 633.2.4 餅圖 643.2.5 直方圖 653.2.6 箱線圖 673.3 自定義設(shè)置 693.3.1 圖例設(shè)置 693.3.2 坐標(biāo)網(wǎng)格設(shè)置 703.3.3 坐標(biāo)系設(shè)置 713.3.4 樣式設(shè)置與注解 723.3.5 RC設(shè)置 733.4 子圖 743.4.1 創(chuàng)建子圖 743.4.2 子圖坐標(biāo)系設(shè)置 763.4.3 圖形嵌套 773.5 繪制三維圖形 78小結(jié) 81習(xí)題 82實(shí)驗(yàn) 82第4章 Pandas數(shù)據(jù)分析 894.1 Pandas數(shù)據(jù)結(jié)構(gòu) 894.2 DataFrame基本功能 944.3 讀取外部數(shù)據(jù) 954.3.1 CSV文件 964.3.2 Sqlite數(shù)據(jù)庫(kù) 984.4 數(shù)據(jù)幀的列操作和行操作 994.4.1 列操作 994.4.2 行操作 1014.5 高級(jí)索引 1034.5.1 重建索引 1034.5.2 更換索引 1064.5.3 層次化索引 1074.6 Pandas數(shù)據(jù)運(yùn)算 1084.6.1 算術(shù)運(yùn)算 1084.6.2 函數(shù)應(yīng)用與映射運(yùn)算 1094.6.3 排序 1114.6.4 迭代 1134.6.5 唯一值與值計(jì)數(shù) 1154.7 統(tǒng)計(jì)函數(shù) 1164.7.1 描述性統(tǒng)計(jì) 1164.7.2 變化率 1194.7.3 協(xié)方差 1204.7.4 相關(guān)性 1204.7.5 數(shù)據(jù)排名 1214.8 分組與聚合 1224.8.1 分組 1224.8.2 聚合 1244.9 透視表與交叉表 1274.9.1 透視表 1274.9.2 交叉表 128小結(jié) 129習(xí)題 129實(shí)驗(yàn) 129第5章 數(shù)據(jù)預(yù)處理 1345.1 數(shù)據(jù)清洗 1345.1.1 重復(fù)值 1345.1.2 缺失值 1355.1.3 異常值 1405.2 合并連接與重塑 1425.2.1 merge合并 1425.2.2 concat合并 1445.2.3 combine_first合并 1465.2.4 數(shù)據(jù)重塑 1475.3 數(shù)據(jù)變換 1495.3.1 虛擬變量 1495.3.2 函數(shù)變換 1505.3.3 連續(xù)屬性離散化 1515.3.4 規(guī)范化 1525.3.5 隨機(jī)采樣 154小結(jié) 156習(xí)題 156實(shí)驗(yàn) 156第6章 Sklearn機(jī)器學(xué)習(xí) 1626.1 術(shù)語(yǔ) 1626.2 Sklearn 1646.2.1 Sklearn數(shù)據(jù)集 1656.2.2 Sklearn常用算法 1716.2.3 數(shù)據(jù)預(yù)處理 1756.2.4 數(shù)據(jù)集拆分 1776.2.5 模型評(píng)估 1776.2.6 Sklearn常用方法 1786.2.7 模型的保存和載入 1796.3 降維 1796.3.1 PCA(主成分分析) 1796.3.2 LDA(線性評(píng)價(jià)分析) 1816.4 回歸 1826.4.1 線性回歸 1836.4.2 邏輯回歸 1846.4.3 回歸決策樹(shù) 1856.5 分類(lèi) 1866.5.1 樸素貝葉斯 1876.5.2 分類(lèi)決策樹(shù) 1886.5.3 SVM(支持向量機(jī)) 1896.5.4 神經(jīng)網(wǎng)絡(luò) 1906.5.5 K?近鄰算法 1916.6 聚類(lèi) 1926.6.1 K?means算法 1936.2.2 DBSCAN 194小結(jié) 195習(xí)題 195實(shí)驗(yàn) 196參考文獻(xiàn) 200