人工智能開發(fā)叢書--Python機器學習集錦
定 價:95 元
叢書名:人工智能開發(fā)叢書
- 作者:潘風文、龐資勝 編著
- 出版時間:2023/7/1
- ISBN:9787122433923
- 出 版 社:化學工業(yè)出版社
- 中圖法分類:TP311.561
- 頁碼:310
- 紙張:
- 版次:01
- 開本:16開
Python是一種面向對象的腳本語言,廣泛應用于Web 開發(fā)、網(wǎng)絡編程、爬蟲開發(fā)、自動化運維、云計算、人工智能、科學計算等領域。本書是作者長期應用Python進行機器學習開發(fā)實踐的經(jīng)驗結晶,主要內容包括Python數(shù)據(jù)讀取的技巧,數(shù)據(jù)探索性分析,數(shù)據(jù)預處理,特征選擇,特征選擇的常用技巧,算法模型,sklearn類庫,Python中數(shù)據(jù)可視化的常用方法等。本書具有針對性、系統(tǒng)性、實操性強,原創(chuàng)度高的特點,讀者對代碼進行簡單修改,就可以直接拿來使用。
本書適合于具有一定Python基礎,且有志于從事機器學習、人工智能開發(fā)的讀者使用。
1 數(shù)據(jù)讀取 1
1.1 數(shù)據(jù)讀取常見問題 2
1.2 核心代碼 4
1.2.1 讀取Excel、csv、txt、json數(shù)據(jù) 4
1.2.2 讀取docx文件和查詢關鍵詞 5
1.2.3 讀取日志、圖像、聲音、視頻 7
1.2.4 Oracle、MySQL數(shù)據(jù)讀取 13
1.2.5 讀取Hive數(shù)據(jù) 18
1.2.6 數(shù)據(jù)導出到本地 19
2 數(shù)據(jù)探索性分析 20
2.1 數(shù)據(jù)查看 21
2.2 數(shù)據(jù)統(tǒng)計 22
2.3 數(shù)據(jù)分組分析 23
2.4 相關性分析 24
2.5 典型案例 25
3 數(shù)據(jù)預處理 28
3.1 注意問題 30
3.2 核心代碼 31
3.2.1 缺失值檢測和處理 31
3.2.2 異常值檢測和處理 34
3.2.3 數(shù)據(jù)標準化規(guī)范化正則化 38
3.2.4 數(shù)據(jù)平滑處理 41
3.2.5 樣本類別分布不均衡處理 47
3.2.6 數(shù)據(jù)降維 51
3.2.7 訓練集驗證集切分 56
3.3 典型案例 66
3.3.1 原理 66
3.3.2 代碼 68
4 特征選擇 69
4.1 過濾式特征提取 70
4.2 遞歸特征消除 73
4.3 嵌入式特征提取 74
4.4 典型案例 76
5 算法建模 79
5.1 主流數(shù)據(jù)挖掘算法 82
5.1.1 有監(jiān)督學習 82
5.1.2 無監(jiān)督學習 193
5.2 自動化調參 212
5.2.1 暴力搜索尋優(yōu) 213
5.2.2 隨機搜索尋優(yōu) 217
5.3 組合分類模型器 221
5.3.1 原理 221
5.3.2 函數(shù)及代碼 221
5.4 典型案例 226
5.4.1 人臉識別 227
5.4.2 多方程模型預測 232
6 可視化 237
6.1 基本圖形 239
6.1.1 折線圖 239
6.1.2 面積圖 248
6.1.3 柱形圖 253
6.1.4 散點圖 268
6.1.5 餅圖 279
6.2 分析圖形 280
6.2.1 詞云圖 280
6.2.2 相似度熱力圖 285
6.2.3 箱式分布圖 291
6.2.4 對應分析圖 306