統(tǒng)計機器學(xué)習(xí)導(dǎo)論
定 價:89 元
叢書名:數(shù)據(jù)科學(xué)與工程技術(shù)叢書
- 作者:[日] 杉山將
- 出版時間:2018/5/1
- ISBN:9787111596790
- 出 版 社:機械工業(yè)出版社
- 中圖法分類:TP181
- 頁碼:352
- 紙張:膠版紙
- 版次:1
- 開本:16開
本書對機器學(xué)習(xí)的關(guān)鍵知識點進行了全面講解,幫助讀者順利完成從理論到實踐的過渡。書中首先介紹用于描述機器學(xué)習(xí)算法的統(tǒng)計與概率的知識,接著詳細(xì)分析機器學(xué)習(xí)技術(shù)的兩類主要方法——生成方法和判別方法,后深入研究了如何使機器學(xué)習(xí)算法在實際應(yīng)用中發(fā)揮更大的作用。本書提供程序源代碼,便于讀者進行數(shù)據(jù)分析實踐。本書適合高等院校計算機、統(tǒng)計等專業(yè)的研究生和高年級本科生閱讀,同時也適合相關(guān)領(lǐng)域的技術(shù)人員參考。
前言機器學(xué)習(xí)是計算機領(lǐng)域的一個學(xué)科,旨在研究原理、算法以及能夠像人類一樣學(xué)習(xí)的系統(tǒng)的應(yīng)用。近年來,計算機和傳感器的發(fā)展使得我們能夠訪問不同領(lǐng)域的海量數(shù)據(jù)(如文本、音頻、圖片、電影、電子商務(wù)、電氣、醫(yī)學(xué)和生物學(xué)等)。在此類大數(shù)據(jù)的分析和利用方面,機器學(xué)習(xí)起到了核心的作用。
本書致力于討論機器學(xué)習(xí)的數(shù)學(xué)背景及多種機器學(xué)習(xí)技術(shù)的實用化算法。目標(biāo)讀者定位于計算機和相關(guān)專業(yè)的本科生和研究生。在工作中應(yīng)用機器學(xué)習(xí)技術(shù)的工程師和分析數(shù)據(jù)的科學(xué)家也會從本書中獲益。
本書特色在于每章的主題簡明扼要,給出具體機器學(xué)習(xí)技術(shù)的數(shù)學(xué)推導(dǎo)并附以簡潔的MATLAB程序。由此,讀者在學(xué)習(xí)數(shù)學(xué)概念的同時,可掌握多種機器學(xué)習(xí)技術(shù)的實用價值。全部MATLAB程序可以從如下網(wǎng)址獲得:
本書第一部分給出機器學(xué)習(xí)領(lǐng)域的簡要概述。緊接著,第二部分介紹了概率和統(tǒng)計的基本概念,它們構(gòu)成了統(tǒng)計機器學(xué)習(xí)的數(shù)學(xué)基礎(chǔ)。第二部分的成文基于:
第三部分和第四部分分別在生成和判別框架下,介紹了一系列實用機器學(xué)習(xí)算法。隨后, 第五部分介紹高級論題,進而處理更具挑戰(zhàn)的機器學(xué)習(xí)任務(wù)。第三部分的成文基于:
第四部分和第五部分的成文基于:
在此感謝東京大學(xué)和東京工業(yè)大學(xué)相關(guān)研究組的研究員和學(xué)生針對本書早期手稿給出的有價值的反饋。
杉山將東京大學(xué)
【加照片】Masashi Sugiyama,東京大學(xué)教授,擁有東京工業(yè)大學(xué)計算機科學(xué)博士學(xué)位,研究興趣包括機器學(xué)習(xí)與數(shù)據(jù)挖掘的理論、算法和應(yīng)用,涉及信號處理、圖像處理、機器人控制等。2007年獲得IBM學(xué)者獎,以表彰其在機器學(xué)習(xí)領(lǐng)域非平穩(wěn)性方面做出的貢獻。2011年獲得日本信息處理協(xié)會頒發(fā)的Nagao特別研究獎,以及日本文部科學(xué)省頒發(fā)的青年科學(xué)家獎,以表彰其對機器學(xué)習(xí)密度比范型的貢獻。
目錄
譯者序
前言
作者簡介
第一部分緒論
第1章統(tǒng)計機器學(xué)習(xí)
1.1學(xué)習(xí)的類型
1.2機器學(xué)習(xí)任務(wù)舉例
1.2.1監(jiān)督學(xué)習(xí)
1.2.2非監(jiān)督學(xué)習(xí)
1.2.3進一步的主題
1.3本書結(jié)構(gòu)
第二部分概率與統(tǒng)計
第2章隨機變量與概率分布
2.1數(shù)學(xué)基礎(chǔ)
2.2概率
2.3隨機變量和概率分布
2.4概率分布的性質(zhì)
2.4.1期望、中位數(shù)和眾數(shù)
2.4.2方差和標(biāo)準(zhǔn)差
2.4.3偏度、峰度和矩
2.5隨便變量的變換
第3章離散概率分布的實例
3.1離散均勻分布
3.2二項分布
3.3超幾何分布
3.4泊松分布
3.5負(fù)二項分布
3.6幾何分布
第4章連續(xù)概率分布的實例
4.1連續(xù)均勻分布
4.2正態(tài)分布
4.3伽馬分布、指數(shù)分布和卡方分布
4.4Beta分布
4.5柯西分布和拉普拉斯分布
4.6t分布和F分布
第5章多維概率分布
5.1聯(lián)合概率分布
5.2條件概率分布
5.3列聯(lián)表
5.4貝葉斯定理
5.5協(xié)方差與相關(guān)性
5.6獨立性
第6章多維概率分布的實例
6.1多項分布
6.2多元正態(tài)分布
6.3狄利克雷分布
6.4威沙特分布
第7章獨立隨機變量之和
7.1卷積
7.2再生性
7.3大數(shù)定律
7.4中心極限定理
第8章概率不等式
8.1聯(lián)合界
8.2概率不等式
8.2.1馬爾可夫不等式和切爾諾夫不等式
8.2.2坎泰利不等式和切比雪夫不等式
8.3期望不等式
8.3.1琴生不等式
8.3.2赫爾德不等式和施瓦茨不等式
8.3.3閔可夫斯基不等式
8.3.4康托洛維奇不等式
8.4獨立隨機變量和的不等式
8.4.1切比雪夫不等式和切爾諾夫不等式
8.4.2霍夫丁不等式和伯恩斯坦不等式
8.4.3貝內(nèi)特不等式
第9章統(tǒng)計估計
9.1統(tǒng)計估計基礎(chǔ)
9.2點估計
9.2.1參數(shù)密度估計
9.2.2非參數(shù)密度估計
9.2.3回歸和分類
9.2.4模型選擇
9.3區(qū)間估計
9.3.1基于正態(tài)樣本期望的區(qū)間估計
9.3.2bootstrap置信區(qū)間
9.3.3貝葉斯置信區(qū)間
第10章假設(shè)檢驗
10.1假設(shè)檢驗基礎(chǔ)
10.2正態(tài)樣本期望的檢驗
10.3尼曼皮爾森引理
10.4列聯(lián)表檢驗
10.5正態(tài)樣本期望差值檢驗
10.5.1無對應(yīng)關(guān)系的兩組樣本
10.5.2有對應(yīng)關(guān)系的兩組樣本
10.6秩的無參檢驗
10.6.1無對應(yīng)關(guān)系的兩組樣本
10.6.2有對應(yīng)關(guān)系的兩組樣本
10.7蒙特卡羅檢驗
第三部分統(tǒng)計模式識別的生成式方法
第11章通過生成模型估計的模式識別
11.1模式識別的公式化
11.2統(tǒng)計模式識別
11.3分類器訓(xùn)練的準(zhǔn)則
11.3.1最大后驗概率規(guī)則
11.3.2最小錯誤分類率準(zhǔn)則
11.3.3貝葉斯決策規(guī)則
11.3.4討論
11.4生成式方法和判別式方法
第12章極大似然估計
12.1定義
12.2高斯模型
12.3類后驗概率的計算
12.4Fisher線性判別分析
12.5手寫數(shù)字識別
12.5.1預(yù)備知識
12.5.2線性判別分析的實現(xiàn)
12.5.3多分類器方法
第13章極大似然估計的性質(zhì)
13.1一致性
13.2漸近無偏性
13.3漸近有效性
13.3.1一維的情況
13.3.2多維的情況
13.4漸近正態(tài)性
13.5總結(jié)
第14章極大似然估計的模型選擇
14.1模型選擇
14.2KL散度
14.3AIC信息論準(zhǔn)則
14.4交叉檢驗
14.5討論
第15章高斯混合模型的極大似然估計
15.1高斯混合模型
15.2極大似然估計
15.3梯度上升算法
15.4EM算法
第16章非參數(shù)估計
16.1直方圖方法
16.2問題描述
16.3核密度估計
16.3.1Parzen 窗法
16.3.2利用核的平滑
16.3.3帶寬的選擇
16.4最近鄰密度估計
16.4.1最近鄰距離
16.4.2最近鄰分類器
第17章貝葉斯推理
17.1貝葉斯預(yù)測分布
17.1.1定義
17.1.2與極大似然估計的比較
17.1.3計算問題
17.2共軛先驗
17.3最大后驗估計
17.4貝葉斯模型選擇
第18章邊緣相似的解析近似
18.1拉普拉斯近似
18.1.1高斯密度估計
18.1.2例證
18.1.3應(yīng)用于邊際似然逼近
18.1.4貝葉斯信息準(zhǔn)則
18.2變分近似
18.2.1變分貝葉斯最大期望算法
18.2.2與一般最大期望法的關(guān)系
第19章預(yù)測分布的數(shù)值近似
19.1蒙特卡羅積分
19.2重要性采樣
19.3采樣算法
19.3.1逆變換采樣
19.3.2拒絕采樣
19.3.3馬爾可夫鏈蒙特卡羅方法
第20章貝葉斯混合模型
20.1高斯混合模型
20.1.1貝葉斯公式化
20.1.2變分推斷
20.1.3吉布斯采樣
20.2隱狄利克雷分配模型
20.2.1主題模型
20.2.2貝葉斯公式化
20.2.3吉布斯采樣
第四部分統(tǒng)計機器學(xué)習(xí)的判別式方法
第21章學(xué)習(xí)模型
21.1線性參數(shù)模型
21.2核模型
21.3層次模型
第22章最小二乘回歸
22.1最小二乘法
22.2線性參數(shù)模型的解決方案
22.3最小二乘法的特性
22.4大規(guī)模數(shù)據(jù)的學(xué)習(xí)算法
22.5層次模型的學(xué)習(xí)算法
第23章具有約束的最小二乘回歸
23.1子空間約束的最小二乘
23.22約束的最小二乘
23.3模型選擇
第24章稀疏回歸
24.11約束的最小二乘
24.2解決1約束的最小二乘
24.3稀疏學(xué)習(xí)的特征選擇
24.4若干擴展
24.4.1廣義1約束最小二乘
24.4.2p約束最小二乘
24.4.31+2約束最小二乘
24.4.41,2約束最小二乘
24.4.5跡范數(shù)約束最小二乘
第25章穩(wěn)健回歸
25.12損失最小化的非穩(wěn)健性
25.21損失最小化
25.3Huber損失最小化
25.3.1定義
25.3.2隨機梯度算法
25.3.3迭代加權(quán)最小二乘
25.3.41約束Huber損失最小化
25.4Tukey 損失最小化
第26章最小二乘分類器
26.1基于最小二乘回歸的分類器
26.20/1損失和間隔
2