隨著大數(shù)據(jù)的興起,Python 和機(jī)器學(xué)習(xí)迅速成為時(shí)代的寵兒。本書在內(nèi)容編排上避免了枯燥的理論知識(shí)講解,依循理論簡(jiǎn)述實(shí)際數(shù)據(jù)集Python 程序?qū)崿F(xiàn)算法分析數(shù)據(jù)的思路,根據(jù)實(shí)際數(shù)據(jù)集的分析目的,采用合適的主流機(jī)器學(xué)習(xí)算法來(lái)解決問(wèn)題。全書共12章,其中第1 ~ 4 章介紹了機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí);第5 ~ 12 章討論了在面對(duì)不同的數(shù)據(jù)時(shí),如何采用一些主流的算法來(lái)解決問(wèn)題,主要包括回歸分析、關(guān)聯(lián)規(guī)則、無(wú)監(jiān)督學(xué)習(xí)、文本LDA 模型、決策樹(shù)和集成學(xué)習(xí)、樸素貝葉斯和K 近鄰分類、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò),以及深
度學(xué)習(xí)入門等內(nèi)容。針對(duì)每個(gè)算法,都給出Python 代碼實(shí)現(xiàn)算法建模的過(guò)程,并結(jié)合可視化技術(shù),幫助讀者更好地理解算法和分析結(jié)果。
《Python 在機(jī)器學(xué)習(xí)中的應(yīng)用》是使用Python 進(jìn)行機(jī)器學(xué)習(xí)的入門實(shí)戰(zhàn)教程,可作為以Python 為基礎(chǔ)進(jìn)行機(jī)器學(xué)習(xí)的本科生和研究生入門書籍,也可供對(duì)Python 機(jī)器學(xué)習(xí)感興趣的研究人員參考閱讀。
第1 章 機(jī)器學(xué)習(xí)簡(jiǎn)介
1.1 機(jī)器學(xué)習(xí)的任務(wù)
1.2 機(jī)器學(xué)習(xí)的三種方式
1.3 機(jī)器學(xué)習(xí)系統(tǒng)的建立
1.4 機(jī)器學(xué)習(xí)實(shí)例
第2 章 Python 常用庫(kù)介紹
2.1 Python 的安裝(Anaconda)
2.1.1 Spyder
2.1.2 Jupyter Notebook
2.2 Python 常用庫(kù)
2.2.1 Numpy 庫(kù)
2.2.2 Pandas 庫(kù)
2.2.3 Matplotlib 庫(kù)
2.2.4 Statsmodels 庫(kù)
2.2.5 Scikit-learn 庫(kù)
2.3 其他Python 常用的數(shù)據(jù)庫(kù)
2.4 Python 各種庫(kù)在機(jī)器學(xué)習(xí)中的應(yīng)用
第3 章 數(shù)據(jù)的準(zhǔn)備和探索
3.1 數(shù)據(jù)預(yù)處理
3.2 數(shù)據(jù)假設(shè)檢驗(yàn)
3.3 數(shù)據(jù)間的關(guān)系
3.4 數(shù)據(jù)可視化
3.5 特征提取和降維
第4 章 模型訓(xùn)練和評(píng)估
4.1 模型訓(xùn)練技巧
4.2 分類效果的評(píng)價(jià)
4.3 回歸模型評(píng)價(jià)
4.4 聚類分析評(píng)估
第5 章 回歸分析
5.1 回歸分析簡(jiǎn)介
5.2 多元線性回歸分析
5.2.1 多元線性回歸
5.2.2 逐步回歸
5.3 Lasso 回歸分析
5.4 Logistic 回歸分析
5.5 時(shí)間序列預(yù)測(cè)
第6 章 關(guān)聯(lián)規(guī)則
6.1 關(guān)聯(lián)規(guī)則簡(jiǎn)介
6.2 使用關(guān)聯(lián)規(guī)則找到問(wèn)卷的規(guī)則
6.3 關(guān)聯(lián)規(guī)則可視化
第7 章 無(wú)監(jiān)督學(xué)習(xí)
7.1 無(wú)監(jiān)督學(xué)習(xí)介紹
7.2 系統(tǒng)聚類
7.3 K- 均值聚類
7.4 密度聚類
7.5 Mean Shift 聚類
7.6 字典學(xué)習(xí)圖像去噪
第8 章 文本LDA 模型
8.1 文本分析簡(jiǎn)介
8.2 中文分詞
8.3 LDA 主題模型分析《紅樓夢(mèng)》
8.4 紅樓夢(mèng)人物關(guān)系
第9 章 決策樹(shù)和集成學(xué)習(xí)
9.1 模型簡(jiǎn)介
9.2 泰坦尼克號(hào)數(shù)據(jù)預(yù)處理
9.3 決策樹(shù)模型
9.4 決策樹(shù)剪枝
9.5 隨機(jī)森林模型
9.6 AdaBoost 模型
第10 章 樸素貝葉斯和K近鄰分類
10.1 模型簡(jiǎn)介
10.2 垃圾郵件數(shù)據(jù)預(yù)處理
10.3 貝葉斯模型識(shí)別垃圾郵件
10.4 基于異常值檢測(cè)的垃圾郵件查找
10.4.1 PCA 異常值檢測(cè)
10.4.2 Isolation Forest 異常值檢測(cè)
10.5 數(shù)據(jù)不平衡問(wèn)題的處理
10.6 K 近鄰分類
第11 章 支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)
11.1 模型簡(jiǎn)介
11.2 肺癌數(shù)據(jù)可視化
11.3 支持向量機(jī)模型
11.4 全連接神經(jīng)網(wǎng)絡(luò)
第12 章 深度學(xué)習(xí)入門
12.1 深度學(xué)習(xí)介紹
12.2 卷積和池化
12.3 CNN 人臉識(shí)別
12.4 CNN 人臉檢測(cè)
12.5 深度卷積圖像去噪
12.5.1 空洞卷積
12.5.2 圖像與圖像塊的相互轉(zhuǎn)換
12.5.3 一種深度學(xué)習(xí)去噪方法