計(jì)算貝葉斯統(tǒng)計(jì)導(dǎo)論
定 價(jià):89 元
叢書名:統(tǒng)計(jì)學(xué)精品譯叢
- 作者:計(jì)算貝葉斯統(tǒng)計(jì)導(dǎo)論
- 出版時(shí)間:2023/3/1
- ISBN:9787111721062
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:F222.1
- 頁碼:
- 紙張:膠版紙
- 版次:
- 開本:16開
有意義地使用高級貝葉斯方法需要對基本原理有很好的理解。這本引人入勝的書解釋了支撐貝葉斯模型構(gòu)建和分析的思想,特別側(cè)重于計(jì)算方法和方案。本書的獨(dú)特之處是對可用軟件包進(jìn)行了廣泛的討論,并對貝葉斯推理進(jìn)行了簡短但完整且數(shù)學(xué)嚴(yán)謹(jǐn)?shù)慕榻B。本書介紹了蒙特卡羅方法、馬爾可夫鏈蒙特卡羅方法和貝葉斯軟件,另外還介紹了模型驗(yàn)證和比較、跨維MCMC和條件高斯模型。本書所包含的問題使本書適合作為貝葉斯計(jì)算的第yi門研究生課程的教科書。對貝葉斯軟件的廣泛討論——R/R- inla、OpenBUGS、JAGS、STAN和BayesX——使得它對來自統(tǒng)計(jì)之外的研究人員和研究生也很有用。
貝葉斯推斷是統(tǒng)計(jì)的前沿理論,每個(gè)從事統(tǒng)計(jì)學(xué)和數(shù)據(jù)處理的研究人員都有必要深入學(xué)習(xí)
前 言
1975年,丹尼斯·林德利(Dennis Lindley)在Advances in Applied Probability(《應(yīng)用概率進(jìn)展》)上發(fā)表了一篇題為“The future of statistics:a Bayesian 21st century”的文章,預(yù)測21世紀(jì)貝葉斯推斷方法在統(tǒng)計(jì)學(xué)中的主導(dǎo)地位。今天,人們可以肯定地說丹尼斯·林德利的預(yù)測是正確的,但他給出的理由并不準(zhǔn)確。他沒有預(yù)料到關(guān)鍵因素是計(jì)算貝葉斯統(tǒng)計(jì)在20世紀(jì)最后十年取得的巨大進(jìn)步。推斷問題的“貝葉斯解決方案”極具吸引力,尤其在推斷結(jié)果的可解釋性方面。然而,在實(shí)踐中,這種解決方案的推導(dǎo),尤其是涉及積分的計(jì)算,在大多數(shù)情況下是多維的,如果不采用模擬,是很難或不可能實(shí)現(xiàn)的;蚨嗷蛏俚膹(fù)雜計(jì)算方法的發(fā)展徹底改變了這種狀況。如今,貝葉斯方法被用于解決幾乎所有科學(xué)領(lǐng)域的問題,尤其是建模過程極其復(fù)雜的問題。然而,貝葉斯方法不能盲目應(yīng)用。盡管存在許多用于貝葉斯分析的軟件包,但研究者了解這些程序輸出的內(nèi)容及其原因至關(guān)重要。
本書的寫作初衷源于第22屆葡萄牙統(tǒng)計(jì)學(xué)會年會(ⅩⅩⅡ Congresso da Sociedade Portuguesa de Estatística)上的一個(gè)小型課程,旨在介紹貝葉斯模型構(gòu)建和分析的基本思想,尤其側(cè)重于計(jì)算方法和方案。
在第1章中,我們簡要介紹了貝葉斯推斷的基礎(chǔ),重點(diǎn)介紹了經(jīng)典范式和貝葉斯范式之間的主要區(qū)別。不幸的是,作為貝葉斯推斷的主要理論支柱之一,先驗(yàn)信息的設(shè)定在應(yīng)用中經(jīng)常被忽視。因此,我們在第2章回顧先驗(yàn)信息相關(guān)內(nèi)容。在第3章中,我們用解析可解的例子來說明統(tǒng)計(jì)推斷問題的貝葉斯解。計(jì)算貝葉斯統(tǒng)計(jì)發(fā)展背后的“偉大思想”是認(rèn)識到貝葉斯推斷可以通過后驗(yàn)分布的模擬實(shí)現(xiàn)。第4章介紹了計(jì)算問題的第一個(gè)解決方案——經(jīng)典蒙特卡羅方法。模型驗(yàn)證是一個(gè)非常重要的問題,在貝葉斯背景下已有其自身的一套概念和問題。第5章簡要回顧了評估、選擇和比較模型最常用的方法。
比第4章中的基本問題更復(fù)雜的問題需要使用更復(fù)雜的模擬方法,尤其是馬爾可夫鏈蒙特卡羅(Markov Chain Monte Carlo,MCMC)方法。第6章用盡可能簡單的方法介紹了這些內(nèi)容。第7章闡述了在高維情況下,當(dāng)適當(dāng)維度的模型選擇不再有效時(shí)的模型選擇問題。模擬的另一種替代方法是使用后驗(yàn)近似法,第8章介紹了相關(guān)內(nèi)容。第8章以一種通用的方式描述了積分嵌套拉普拉斯近似(Integrated Nested Laplace Approximation,INLA)的使用,該方法在計(jì)算時(shí)間(通過幾個(gè)因素)和所報(bào)告的推斷匯總的精度等方面都取得了實(shí)質(zhì)性改進(jìn)。雖然適用于一大類問題,但與隨機(jī)模擬相比,該方法受到更多限制。最后,第9章專門介紹了貝葉斯軟件。借助MCMC方法進(jìn)行后驗(yàn)?zāi)M的可能性支持了BUGS軟件的發(fā)展,這使得貝葉斯推斷可以在許多科學(xué)領(lǐng)域的各種問題中使用?傮w而言,技術(shù)的快速發(fā)展以及人們對海量數(shù)據(jù)集(“大數(shù)據(jù)”)處理的需求改變了統(tǒng)計(jì)的范式,這些數(shù)據(jù)通常是空間和時(shí)間類型的數(shù)據(jù)。因此,復(fù)雜高維數(shù)據(jù)問題的后驗(yàn)?zāi)M已經(jīng)成為一個(gè)新的挑戰(zhàn),它帶來了新的、更好的計(jì)算方法和更優(yōu)秀的軟件,這些軟件可以克服BUGS軟件以及它的后繼者(如WinBUGS和OpenBUGS)的早期局限性。在第9章中,我們回顧了實(shí)現(xiàn)MCMC方法及其變化形式的其他統(tǒng)計(jì)數(shù)據(jù)包,如JAGS、Stan和BayesX。這一章還簡要介紹了如何實(shí)現(xiàn)INLA的R語言包R-INLA。
在本書的編寫過程中,我們主要參考了Paulino、A.Turkman和Murteira合著的Estatistica Bayesiana一書,該書由Fundao Calouste Gulbenkian于2003年出版。由于這本書在很久以前就已經(jīng)售罄,因此,我們廣泛使用了即將出版的該書第2版的前期工作內(nèi)容,以及我們在2013年10月的葡萄牙統(tǒng)計(jì)學(xué)會(SPE)公報(bào)中發(fā)表的相關(guān)內(nèi)容。
如果沒有我們親愛的朋友和同事Giovani Silva的寶貴建議和始終如一的支持,本書是無法以目前的形式呈現(xiàn)的。我們應(yīng)該真誠地感謝他。我們還感謝葡萄牙統(tǒng)計(jì)學(xué)會提出了更廣泛的貝葉斯統(tǒng)計(jì)主題,并有機(jī)會在該學(xué)會第22屆會議上開設(shè)一個(gè)小型課程。我們還感謝里斯本大學(xué)理學(xué)院統(tǒng)計(jì)與運(yùn)籌學(xué)系下屬的統(tǒng)計(jì)和應(yīng)用中心(PEst-OE/MAT/UI0006/2014,UID/MAT/00006/2013)和高等技術(shù)學(xué)院數(shù)學(xué)系提供的支持。我們還要感謝科學(xué)技術(shù)基金會多年來提供的各種項(xiàng)目支持,這使我們能夠在貝葉斯統(tǒng)計(jì)領(lǐng)域積累相關(guān)的專業(yè)知識。
最后,我們想把這本書獻(xiàn)給Bento Murteira教授,他對葡萄牙的貝葉斯統(tǒng)計(jì)領(lǐng)域的發(fā)展功不可沒。事實(shí)上,本書的第1章在很多方面借鑒了他的寫作風(fēng)格。
瑪麗亞·安特尼亞·阿馬拉爾·土庫曼教授曾是里斯本大學(xué)理學(xué)院統(tǒng)計(jì)與運(yùn)籌學(xué)系的教授,現(xiàn)已退休。她曾擔(dān)任葡萄牙統(tǒng)計(jì)學(xué)會副會長。她的研究興趣有貝葉斯統(tǒng)計(jì)、醫(yī)學(xué)和環(huán)境統(tǒng)計(jì)以及時(shí)空建模等。
卡洛斯·丹尼爾·保利諾是里斯本大學(xué)統(tǒng)計(jì)和應(yīng)用中心的高級研究員,同時(shí)也是該校高等技術(shù)學(xué)院數(shù)學(xué)系副教授。他曾擔(dān)任葡萄牙統(tǒng)計(jì)學(xué)會會長。他在貝葉斯統(tǒng)計(jì)和分類數(shù)據(jù)方向論著頗豐,重點(diǎn)關(guān)注貝葉斯方法在生物統(tǒng)計(jì)學(xué)中的應(yīng)用。
彼得·穆勒是得克薩斯大學(xué)奧斯汀分校數(shù)學(xué)系和統(tǒng)計(jì)與數(shù)據(jù)科學(xué)系的副教授。他曾擔(dān)任國際貝葉斯分析學(xué)會主席和美國統(tǒng)計(jì)協(xié)會貝葉斯統(tǒng)計(jì)分會主席。他主要研究貝葉斯統(tǒng)計(jì)計(jì)算方法、非參數(shù)貝葉斯統(tǒng)計(jì)和決策問題等。
前言
第1章 貝葉斯推斷1 1.1 經(jīng)典范式1
1.2 貝葉斯范式4
1.3 貝葉斯推斷7
1.3.1 參數(shù)推斷7
1.3.2 預(yù)測推斷10
1.4 結(jié)論11
習(xí)題12第2章 先驗(yàn)信息表示14 2.1 無信息先驗(yàn)14
2.2 自然共軛先驗(yàn)19
習(xí)題22第3章 基礎(chǔ)問題中的貝葉斯
推斷24 3.1 二項(xiàng)分布與貝塔模型24
3.2 泊松分布與伽馬模型25
3.3 正態(tài)分布(μ已知)與
逆伽馬模型26
3.4 正態(tài)分布(μ,σ2未知)與
杰弗里斯先驗(yàn)27
3.5 兩個(gè)獨(dú)立的正態(tài)模型與
邊緣杰弗里斯先驗(yàn)28
3.6 兩個(gè)獨(dú)立的二項(xiàng)分布與
貝塔分布30
3.7 多項(xiàng)分布與狄利克雷模型31
3.8 有限總體中的推斷34
習(xí)題35第4章 蒙特卡羅方法推斷38 4.1 簡單蒙特卡羅方法38
4.1.1 后驗(yàn)概率41
4.1.2 可信區(qū)間41
4.1.3 邊緣后驗(yàn)分布42
4.1.4 預(yù)測匯總44
4.2 重要性抽樣蒙特卡羅方法44
4.2.1 可信區(qū)間47
4.2.2 貝葉斯因子49
4.2.3 邊緣后驗(yàn)密度51
4.3 序貫蒙特卡羅方法52
4.3.1 動(dòng)態(tài)狀態(tài)空間模型52
4.3.2 粒子濾波器54
4.3.3 自適應(yīng)粒子濾波器55
4.3.4 參數(shù)學(xué)習(xí)56
習(xí)題57第5章 模型評估62 5.1 模型評判與充分性62
5.2 模型選擇與比較67
5.2.1 預(yù)測性能度量67
5.2.2 通過后驗(yàn)預(yù)測性能進(jìn)行
選擇71
5.2.3 使用貝葉斯因子進(jìn)行
模型選擇73
5.3 模型評估中模擬的更多
說明74
5.3.1 評估后驗(yàn)預(yù)測分布74
5.3.2 先驗(yàn)預(yù)測密度估計(jì)75
5.3.3 從預(yù)測分布中抽樣76
習(xí)題77第6章 馬爾可夫鏈蒙特卡羅
方法79 6.1 馬爾可夫鏈的定義和
基本結(jié)果80
6.2 梅特羅波利斯-黑斯廷斯
算法82
6.3 吉布斯抽樣器86
6.4 切片抽樣器92
6.5 哈密頓蒙特卡羅93
6.5.1 哈密頓動(dòng)力學(xué)93
6.5.2 哈密頓蒙特卡羅轉(zhuǎn)移
概率96
6.6 實(shí)現(xiàn)細(xì)節(jié)99
習(xí)題102第7章 模型選擇和跨維
MCMC113 7.1 參數(shù)空間上的MC模擬113
7.2 模型空間上的MC模擬114
7.3 模型和參數(shù)空間上的MC
模擬119
7.4 可逆跳躍MCMC121
習(xí)題125第8章 基于解析近似的方法131 8.1 解析方法131
8.1.1 多元正態(tài)后驗(yàn)近似131
8.1.2 經(jīng)典拉普拉斯方法134
8.2 潛高斯模型139
8.3 積分嵌套拉普拉斯近似141
8.4 變分貝葉斯推斷143
8.4.1 后驗(yàn)近似143
8.4.2 坐標(biāo)上升算法144
8.4.3 自動(dòng)微分變分推斷147
習(xí)題147第9章 軟件151 9.1 應(yīng)用實(shí)例151
9.2 BUGS項(xiàng)目:WinBUGS和
OpenBUGS152
9.2.1 應(yīng)用實(shí)例:
使用R2OpenBUGS154
9.3 JAGS159
9.3.1 應(yīng)用實(shí)例:
使用R2jags160
9.4 Stan163
9.4.1 應(yīng)用實(shí)例:
使用RStan164
9.5 BayesX171
9.5.1 應(yīng)用實(shí)例:
使用R2BayesX172
9.6 收斂性診斷:CODA程序和
BOA程序176
9.6.1 收斂性診斷176
9.6.2 CODA包和BOA包178
9.6.3 應(yīng)用實(shí)例:
CODA和BOA180
9.7 R-INLA和應(yīng)用實(shí)例190
9.7.1 應(yīng)用實(shí)例192
習(xí)題198附錄200
附錄A200
附錄B206索引209參考文獻(xiàn)213