MATLAB為機器學(xué)習領(lǐng)域提供了必要的工具。用戶可以借助MATLAB環(huán)境提供的強大交互式圖形界面,非常輕松地解決機器學(xué)習問題。
本書在介紹每個主題前,會簡要概述其理論基礎(chǔ),然后輔以實際案例進行闡釋。通過閱讀本書,讀者能夠應(yīng)用機器學(xué)習方法,并能充分利用MATLAB的功能解決實際問題。
《MATLAB機器學(xué)習》前3章主要介紹MATLAB機器學(xué)習的基礎(chǔ)知識、使用MATLAB導(dǎo)入數(shù)據(jù)和組織數(shù)據(jù)的方法以及從數(shù)據(jù)到知識發(fā)掘的方法,中間3章主要介紹回歸分析、分類分析以及無監(jiān)督學(xué)習,最后3章介紹人工神經(jīng)網(wǎng)絡(luò)、降維變換的方法以及機器學(xué)習實戰(zhàn)的相關(guān)知識。
本書可供數(shù)據(jù)分析員、數(shù)據(jù)科學(xué)家以及任何希望學(xué)習機器學(xué)習算法以及構(gòu)建數(shù)據(jù)處理、預(yù)測應(yīng)用的讀者閱讀。
1. 知名MATLAB專家用 MATLAB 進行機器學(xué)習建模的入門書。
2. 真實案例+圖表展示多種回歸模型,真實再現(xiàn)用MATLAB實現(xiàn)數(shù)據(jù)應(yīng)用,且側(cè)重于實際應(yīng)用。
3. 中國量化投資學(xué)會MATLAB技術(shù)分會會長、MATLAB技術(shù)論壇聯(lián)合創(chuàng)始人李洋領(lǐng)銜翻譯,在原書基礎(chǔ)上增加了專業(yè)、細致的修訂。
朱塞佩·恰布羅(Giuseppe Ciaburro),獲有意大利那不勒斯腓特烈二世大學(xué)(Università degli Studi di Napoli Federico Ⅱ)的化學(xué)工程碩士學(xué)位和那不勒斯第二大學(xué)(Seconda Università degli Studi di Napoli)的聲學(xué)和噪聲控制碩士學(xué)位。他目前在意大利坎帕尼亞的一所大學(xué)(Università degli Studi della Campania“Luigi Vanvitelli”)的建成環(huán)境控制實驗室工作。他在燃燒領(lǐng)域以及聲學(xué)和噪聲控制領(lǐng)域方面有15年以上的編程工作經(jīng)驗。他使用的核心編程語言是Python和R,并且在使用MATLAB上也有豐富的經(jīng)驗。Giuseppe雖為聲學(xué)和噪聲控制領(lǐng)域的專家,但他在專業(yè)計算機課程的教學(xué)以及在線課程方面也有豐富的經(jīng)驗。他出版過專著,也在科學(xué)期刊、主題會議上發(fā)表過文章。近期他的研究方向是將機器學(xué)習應(yīng)用到聲學(xué)和噪聲控制理論中。
第 1章 MATLAB機器學(xué)習初體驗 1
1.1 機器學(xué)習基礎(chǔ) 1
1.2 機器學(xué)習算法的分類 4
1.2.1 監(jiān)督學(xué)習 4
1.2.2 非監(jiān)督學(xué)習 5
1.2.3 強化學(xué)習 5
1.3 選擇正確的算法 6
1.4 構(gòu)建機器學(xué)習模型的流程 7
1.5 MATLAB中的機器學(xué)習支持簡介 8
1.5.1 操作系統(tǒng)、硬件平臺要求 10
1.5.2 MATLAB安裝要求 11
1.6 統(tǒng)計機器學(xué)習工具箱 11
1.6.1 數(shù)據(jù)類型 13
1.6.2 統(tǒng)計機器學(xué)習工具箱功能簡介 13
1.7 神經(jīng)網(wǎng)絡(luò)工具箱 18
1.8 MATLAB中的統(tǒng)計學(xué)和線性代數(shù) 19
1.9 總結(jié) 21
第 2章 使用MATLAB導(dǎo)入數(shù)據(jù)和組織數(shù)據(jù) 22
2.1 熟悉MATLAB桌面 22
2.2 將數(shù)據(jù)導(dǎo)入MATLAB 27
2.2.1 導(dǎo)入向?qū)А?7
2.2.2 通過程序語句導(dǎo)入數(shù)據(jù) 29
2.3 從MATLAB導(dǎo)出數(shù)據(jù) 36
2.4 處理媒體文件 37
2.4.1 處理圖像數(shù)據(jù) 37
2.4.2 音頻的導(dǎo)入/導(dǎo)出 39
2.5 數(shù)據(jù)組織 39
2.5.1 元胞數(shù)組 40
2.5.2 結(jié)構(gòu)體數(shù)組 42
2.5.3 table類型 44
2.5.4 分類數(shù)組 46
2.6 總結(jié) 47
第3章 從數(shù)據(jù)到知識挖掘 49
3.1 區(qū)分變量類別 50
3.1.1 定量變量 50
3.1.2 定性變量 50
3.2 數(shù)據(jù)準備 51
3.2.1 初步查看數(shù)據(jù) 51
3.2.2 找到缺失值 53
3.2.3 改變數(shù)據(jù)類型 54
3.2.4 替換缺失值 54
3.2.5 移除缺失值 55
3.2.6 為表格排序 56
3.2.7 找到數(shù)據(jù)中的異常值 56
3.2.8 將多個數(shù)據(jù)源合并成一個數(shù)據(jù)源 57
3.3 探索性統(tǒng)計指標—數(shù)值測量 59
3.3.1 位置測量 59
3.3.2 分散度的測量 61
3.3.3 分布形狀的測量 64
3.4 探索性可視化 66
3.4.1 圖形數(shù)據(jù)統(tǒng)計分析對話框 67
3.4.2 柱狀圖 70
3.4.3 箱形圖 75
3.4.4 散點圖 77
3.5 總結(jié) 78
第4章 找到變量之間的關(guān)系—回歸方法 80
4.1 尋找線性關(guān)系 80
4.1.1 最小二乘回歸 81
4.1.2 基本擬合接口 86
4.2 如何創(chuàng)建一個線性回歸模型 88
4.2.1 通過穩(wěn)健回歸消除異常值的影響 93
4.2.2 多元線性回歸 96
4.3 多項式回歸 101
4.4 回歸學(xué)習器App 103
4.5 總結(jié) 107
第5章 模式識別之分類算法 108
5.1 決策樹分類 108
5.2 概率分類模型—樸素貝葉斯分類 115
5.2.1 概率論基礎(chǔ) 116
5.2.2 使用樸素貝葉斯進行分類 119
5.2.3 MATLAB中的貝葉斯方法 120
5.3 判別分析分類 123
5.4 k鄰近算法 128
5.5 MATLAB分類學(xué)習器App 132
5.6 總結(jié) 136
第6章 無監(jiān)督學(xué)習 137
6.1 聚類分析簡介 137
6.1.1 相似度與離散度指標 138
6.1.2 聚類方法類型簡介 139
6.2 層次聚類算法 141
6.2.1 層次聚類中的相似度指標 141
6.2.2 定義層次聚類中的簇 143
6.2.3 如何理解層次聚類圖 145
6.2.4 驗證聚類結(jié)果 147
6.3 k均值聚類—基于均值聚類 148
6.3.1 k均值算法 148
6.3.2 函數(shù)kmeans() 149
6.3.3 silhouette圖—可視化聚類結(jié)果 152
6.4 k中心點聚類—基于樣本中心聚類 153
6.4.1 什么是中心點 154
6.4.2 函數(shù)kmedoids() 154
6.4.3 評估聚類結(jié)果 156
6.5 高斯混合模型聚類 156
6.5.1 高斯分布 156
6.5.2 MATLAB中的GMM支持 157
6.5.3 使用后驗概率分布進行聚類 159
6.6 總結(jié) 160
第7章 人工神經(jīng)網(wǎng)絡(luò)——模擬人腦的思考方式 162
7.1 神經(jīng)網(wǎng)絡(luò)簡介 162
7.2 神經(jīng)網(wǎng)絡(luò)基礎(chǔ)構(gòu)成 165
7.2.1 隱藏層數(shù)量 170
7.2.2 每層的節(jié)點數(shù)量 170
7.2.3 神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法 170
7.3 神經(jīng)網(wǎng)絡(luò)工具箱 171
7.4 工具箱的用戶界面 175
7.5 使用神經(jīng)網(wǎng)絡(luò)進行數(shù)據(jù)擬合 176
7.5.1 如何使用擬合App(nftool) 178
7.5.2 腳本分析 186
7.6 總結(jié) 188
第8章 降維——改進機器學(xué)習模型的性能 190
8.1 特征選擇 190
8.1.1 分步回歸 191
8.1.2 MATLAB中的分步回歸 192
8.2 特征提取 199
8.3 總結(jié) 210
第9章 機器學(xué)習實戰(zhàn) 211
9.1 用于預(yù)測混凝土質(zhì)量的數(shù)據(jù)擬合 211
9.2 使用神經(jīng)網(wǎng)絡(luò)診斷甲狀腺疾病 222
9.3 使用模糊聚類對學(xué)生進行分簇 226
9.4 總結(jié) 231