国产成人久久精选无码,久久毛片电影

本書探討了如何使用 R 語言進行機器學習，涵蓋基本的原理和方法，并通過大量的示例和練習，讓讀者掌握 R 語言的數(shù)據(jù)處理技巧。本書包括入門、回歸、分類、模型的評估和改進、無監(jiān)督學習五大部分，涉及線性回歸、logistic 回歸、k 近鄰、樸素貝葉斯、決策樹、聚類和關(guān)聯(lián)規(guī)則等機器學習模型。本書配套提供相關(guān)的代碼和數(shù)據(jù)，方便讀者學習和使用。本書適合 R 語言和機器學習的愛好者、從業(yè)者以及相關(guān)院校的師生選用。

目錄第一部分　入門第 1 章　什么是機器學習 2 1.1　從數(shù)據(jù)中發(fā)現(xiàn)知識 2 1.1.1　算法介紹 3 1.1.2　人工智能、機器學習和深度學習 3 1.2　機器學習技術(shù) 4 1.2.1　監(jiān)督學習 4 1.2.2　無監(jiān)督學習 7 1.3　模型選擇 9 1.3.1　分類技術(shù) 9 1.3.2　回歸技術(shù) 9 1.3.3　相似性學習技術(shù) 10 1.4　評估模型 10 1.4.1　分類錯誤 11 1.4.2　回歸錯誤 12 1.4.3　錯誤類型 13 1.4.4　分割數(shù)據(jù)集 14 1.5　練習 15 第 2 章　R 和 RStudio 簡介 17 2.1　歡迎來到 R 17 2.2 R 和 RStudio 組件 18 2.2.1 R 語言 18 2.2.2 RStudio 19 2.2.3 R 包 26 2.3　編寫和運行 R 腳本 29 2.4 R 中的數(shù)據(jù)類型 31 2.4.1　向量 32 2.4.2　測試數(shù)據(jù)類型 33 2.4.3　轉(zhuǎn)換數(shù)據(jù)類型 36 2.4.4　缺失值 36 2.5　練習 37 第 3 章　數(shù)據(jù)管理 38 3.1 tidyverse 38 3.2　數(shù)據(jù)收集 39 3.2.1　主要考慮因素 39 3.2.2　導入數(shù)據(jù) 40 3.3　數(shù)據(jù)探索 43 3.3.1　數(shù)據(jù)描述 43 3.3.2　數(shù)據(jù)可視化 48 3.4　數(shù)據(jù)準備 52 3.4.1　數(shù)據(jù)清洗 53 3.4.2　數(shù)據(jù)轉(zhuǎn)換 59 3.4.3　減少數(shù)據(jù) 64 3.5　練習 69 第二部分　回歸第 4 章　線性回歸 72 4.1　自行車租賃與回歸 72 4.2　變量之間的關(guān)系 73 4.2.1　相關(guān)性 74 4.2.2　回歸 79 4.3　簡單線性回歸 80 4.3.1　普通最小二乘法 81 4.3.2　簡單線性回歸模型 82 4.3.3　評估模型 82 4.4　多元線性回歸 85 4.4.1　多元線性回歸模型 86 4.4.2　評估模型 86 4.4.3　改進模型 93 4.4.4　優(yōu)缺點 100 4.5　案例研究：預(yù)測血壓 101 4.5.1　導入數(shù)據(jù) 102 4.5.2　探索數(shù)據(jù) 102 4.5.3　簡單線性回歸模型的擬合 104 4.5.4　多元線性回歸模型的擬合 105 4.6　練習 111 第 5 章　logistic 回歸 113 5.1　尋找潛在捐贈者 113 5.2　分類 115 5.3 logistic 回歸 116 5.3.1　優(yōu)勢比 117 5.3.2　二分類 logistic 回歸模型 120 5.3.3　評估模型 129 5.3.4　改進模型 135 5.3.5　優(yōu)缺點 140 5.4　案例研究：收入預(yù)測 140 5.4.1　導入數(shù)據(jù) 141 5.4.2　探索和準備數(shù)據(jù) 141 5.4.3　訓練模型 144 5.4.4　評估模型 146 5.5　練習 147 第三部分　分類第 6 章　k 近鄰 152 6.1　檢測心臟病 152 6.2 k 近鄰 154 6.2.1　發(fā)現(xiàn)最近鄰居 155 6.2.2　標記未標記數(shù)據(jù) 157 6.2.3　選擇合適的 k 157 6.2.4 k 近鄰模型 158 6.2.5　評估模型 162 6.2.6　改進模型 163 6.2.7　優(yōu)缺點 164 6.3　案例研究：重新分析捐贈者數(shù)據(jù)集 165 6.3.1　導入數(shù)據(jù) 165 6.3.2　探索和準備數(shù)據(jù) 165 6.3.3　建立模型 169 6.3.4　評估模型 170 6.4　練習 170 第 7 章　樸素貝葉斯 171 7.1　垃圾郵件分類 171 7.2　樸素貝葉斯 172 7.2.1　概率 173 7.2.2　聯(lián)合概率 173 7.2.3　條件概率 174 7.2.4　樸素貝葉斯分類 175 7.2.5　可加性平滑 177 7.2.6　樸素貝葉斯模型 178 7.2.7　評估模型 182 7.2.8　樸素貝葉斯分類器的優(yōu)缺點 183 7.3　案例研究：重新審視心臟病檢測問題 183 7.3.1　導入數(shù)據(jù) 183 7.3.2　探索和準備數(shù)據(jù) 184 7.3.3　建立模型 185 7.3.4　評估模型 186 7.4　練習 186 第 8 章　決策樹 188 8.1　預(yù)測許可證決策 188 8.2　決策樹 189 8.2.1　遞歸分區(qū) 190 8.2.2　熵 193 8.2.3　信息增益 194 8.2.4　基尼不純度 196 8.2.5　剪枝 196 8.2.6　建立分類樹模型 197 8.2.7　評估模型 200 8.2.8　決策樹的優(yōu)缺點 202 8.3　案例研究：重新審視收入預(yù)測問題 203 8.3.1　導入數(shù)據(jù) 203 8.3.2　探索和準備數(shù)據(jù) 204 8.3.3　建立模型 205 8.3.4　評估模型 205 8.4　練習 206 第四部分　模型的評估和改進第 9 章　評估模型 208 9.1　評估未來表現(xiàn) 208 9.1.1　交叉驗證 210 9.1.2　自助抽樣 215 9.2　超越預(yù)測準確性 217 9.2.1 Kappa 218 9.2.2　查準率和查全率 220 9.2.3　靈敏度和特異性 222 9.3　可視化模型性能 225 9.3.1　接收者操作特性曲線 225 9.3.2　曲線下面積 228 9.4　練習 230 第 10 章　改進模型 232 10.1　調(diào)整參數(shù) 232 10.1.1　自動參數(shù)調(diào)整 232 10.1.2　自定義參數(shù)調(diào)整 236 10.2　集成方法 240 10.2.1　裝袋 241 10.2.2　提升 243 10.2.3　堆疊 245 10.3　練習 249 第五部分　無監(jiān)督學習第 11 章　用關(guān)聯(lián)規(guī)則發(fā)現(xiàn)模式 252 11.1　超市購物籃分析 252 11.2　關(guān)聯(lián)規(guī)則 253 11.2.1　識別強規(guī)則 254 11.2.2 Apriori 算法 255 11.3　發(fā)現(xiàn)關(guān)聯(lián)規(guī)則 256 11.3.1　生成規(guī)則 257 11.3.2　評估規(guī)則 260 11.3.3　優(yōu)缺點 263 11.4　案例研究：識別雜貨店購買模式 263 11.4.1　導入數(shù)據(jù) 264 11.4.2　探索和預(yù)處理數(shù)據(jù) 264 11.4.3　生成規(guī)則 265 11.4.4　評估規(guī)則 266 11.5　練習 268 11.6　參考文獻 268 第 12 章　用聚類對數(shù)據(jù)分組 269 12.1　聚類 269 12.2 k 均值聚類 271 12.3　基于 k 均值聚類的大學細分 274 12.3.1　創(chuàng)建簇 275 12.3.2　分析簇 277 12.3.3　選擇最佳簇數(shù) 278 12.3.4 k 均值聚類的優(yōu)缺點 282 12.4　案例研究：對購物中心客戶進行細分 282 12.4.1　探索和準備數(shù)據(jù) 283 12.4.2　聚類數(shù)據(jù) 283 12.4.3　評估簇 284 12.5　練習 285 12.6　參考文獻 286

你還可能感興趣

我要評論