集成學(xué)習(xí)入門與實戰(zhàn):原理、算法與應(yīng)用
定 價:69.8 元
- 作者:(印度)阿洛克·庫馬爾(Alok Kumar)、(印度)馬揚克·賈因(Mayank Jain) 著
- 出版時間:2022/2/1
- ISBN:9787122401670
- 出 版 社:化學(xué)工業(yè)出版社
- 中圖法分類:TP181
- 頁碼:122
- 紙張:
- 版次:01
- 開本:大16開
《集成學(xué)習(xí)入門與實戰(zhàn):原理、算法與應(yīng)用》通過6章內(nèi)容全面地解讀了集成學(xué)習(xí)的基礎(chǔ)知識、集成學(xué)習(xí)技術(shù)、集成學(xué)習(xí)庫和實踐應(yīng)用。其中集成學(xué)習(xí)技術(shù)包括采樣、Bagging、投票集成、Boosting、AdaBoost、梯度提升、XGBoost、Stacking、隨機森林、決策樹等,從混合訓(xùn)練數(shù)據(jù)到混合模型,再到混合組合,邏輯嚴(yán)謹(jǐn)、逐步講解;同時也對ML-集成學(xué)習(xí)、Dask、LightGBM、AdaNet等集成學(xué)習(xí)庫相關(guān)技術(shù)進(jìn)行了詳細(xì)解讀;最后通過相關(guān)實踐對集成學(xué)習(xí)進(jìn)行綜合性應(yīng)用。本書配有邏輯框圖、關(guān)鍵代碼及代碼分析,使讀者在閱讀中能夠及時掌握算法含義和對應(yīng)代碼。
本書適合集成學(xué)習(xí)的初學(xué)者和機器學(xué)習(xí)方向的從業(yè)者和技術(shù)人員閱讀學(xué)習(xí),也適合開設(shè)機器學(xué)習(xí)等算法課程的高等院校師生使用。
第1章 為什么需要集成學(xué)習(xí) 001
1.1 混合訓(xùn)練數(shù)據(jù) 003
1.2 混合模型 004
1.3 混合組合 008
1.4 本章小結(jié) 009
第2章 混合訓(xùn)練數(shù)據(jù) 011
2.1 決策樹 013
2.2 數(shù)據(jù)集采樣 018
2.2.1 不替換采樣(WOR) 018
2.2.2 替換采樣(WR) 019
2.3 Bagging(裝袋算法) 021
2.3.1 k重交叉驗證 024
2.3.2 分層的k重交叉驗證 026
2.4 本章小結(jié) 028
第3章 混合模型 029
3.1 投票集成 030
3.2 硬投票 031
3.3 均值法/軟投票 033
3.4 超參數(shù)調(diào)試集成 036
3.5 水平投票集成 038
3.6 快照集成 044
3.7 本章小結(jié) 046
第4章 混合組合 047
4.1 Boosting(提升算法) 048
4.1.1 AdaBoost(自適應(yīng)提升算法) 049
4.1.2 Gradient Boosting(梯度提升算法) 051
4.1.3 XGBoost(極端梯度提升算法) 053
4.2 Stacking(堆疊算法) 055
4.3 本章小結(jié) 058
第5章 集成學(xué)習(xí)庫 059
5.1 ML-集成學(xué)習(xí) 060
5.1.1 多層集成 063
5.1.2 集成模型的選擇 064
5.2 通過Dask擴展XGBoost 069
5.2.1 Dask數(shù)組與數(shù)據(jù)結(jié)構(gòu) 071
5.2.2 Dask-ML 076
5.2.3 擴展XGBoost 079
5.2.4 微軟LightGBM 082
5.2.5 AdaNet 088
5.3 本章小結(jié) 090
第6章 實踐指南 092
6.1 基于隨機森林的特征選擇 093
6.2 基于集成樹的特征轉(zhuǎn)換 096
6.3 構(gòu)建隨機森林分類器預(yù)處理程序 103
6.4 孤立森林進(jìn)行異常點檢測 110
6.5 使用Dask庫進(jìn)行集成學(xué)習(xí)處理 114
6.5.1 預(yù)處理 115
6.5.2 超參數(shù)搜索 117
6.6 本章小結(jié) 121
致謝 122