數(shù)據(jù)科學(xué)統(tǒng)計(jì)基礎(chǔ)(第2版)
定 價(jià):59 元
叢書名:數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)叢書
- 作者:呂曉玲,黃丹陽,李偉
- 出版時(shí)間:2024/5/1
- ISBN:9787300326986
- 出 版 社:中國人民大學(xué)出版社
《數(shù)據(jù)科學(xué)統(tǒng)計(jì)基礎(chǔ)》(第2版)內(nèi)容特色鮮明,緊扣數(shù)據(jù)科學(xué)與人工智能時(shí)代的統(tǒng)計(jì)學(xué)發(fā)展需求。本書在保持第1版強(qiáng)調(diào)統(tǒng)計(jì)學(xué)作為方法論學(xué)科特色的基礎(chǔ)上,進(jìn)行了多方面的改進(jìn)與更新。第2版不僅調(diào)整了部分章節(jié)順序和內(nèi)容安排,使之更符合統(tǒng)計(jì)學(xué)的邏輯體系,而且增加了新的統(tǒng)計(jì)方法和實(shí)例,如增強(qiáng)了最大似然估計(jì)的理論和實(shí)例介紹,增加了拒絕域、勢函數(shù)等假設(shè)檢驗(yàn)中的重要概念,以及引入了MCMC方法并提供了該方法的R語言代碼實(shí)現(xiàn)。
本書注重理論與實(shí)踐相結(jié)合,通過大量的例題和習(xí)題,幫助學(xué)生深入理解統(tǒng)計(jì)理論和方法。同時(shí),第2版還加強(qiáng)了計(jì)算機(jī)實(shí)踐環(huán)節(jié),以R語言為基礎(chǔ),介紹了與知識點(diǎn)相關(guān)的R語言操作,有助于學(xué)生掌握現(xiàn)代統(tǒng)計(jì)學(xué)的計(jì)算工具,提高解決實(shí)際問題的能力。
此外,本書還強(qiáng)調(diào)批判性思考,通過書中的批判性思考題目,鼓勵(lì)學(xué)生對統(tǒng)計(jì)方法的應(yīng)用進(jìn)行獨(dú)立思考和評價(jià),引導(dǎo)學(xué)生對統(tǒng)計(jì)學(xué)的深層次問題進(jìn)行探討,培養(yǎng)學(xué)生的邏輯思維能力、分析能力、創(chuàng)新能力,以及科學(xué)精神。
本書是一本受眾群體廣泛的統(tǒng)計(jì)學(xué)教材,無論是統(tǒng)計(jì)學(xué)專業(yè)和數(shù)據(jù)科學(xué)相關(guān)專業(yè)的學(xué)生、統(tǒng)計(jì)工作者和研究人員,還是對統(tǒng)計(jì)學(xué)感興趣的自學(xué)者,都可以從中獲得有價(jià)值的知識和啟示。
呂曉玲,中國人民大學(xué)統(tǒng)計(jì)學(xué)院教授,博士生導(dǎo)師;數(shù)據(jù)科學(xué)與大數(shù)據(jù)統(tǒng)計(jì)系系主任;中國人民大學(xué)數(shù)據(jù)挖掘中心主任。奧地利約翰·開普勒林茨大學(xué)應(yīng)用統(tǒng)計(jì)系以及美國加州大學(xué)伯克利分校統(tǒng)計(jì)系訪問學(xué)者。一直從事統(tǒng)計(jì)機(jī)器學(xué)習(xí)、數(shù)據(jù)科學(xué)領(lǐng)域的研究。主持教育部人文社會(huì)科學(xué)研究項(xiàng)目以及國家自然科學(xué)基金項(xiàng)目。在Journal of the American Statistical Association,Journal of Electronic Commerce Research等SSCI/SCI檢索的國際學(xué)術(shù)期刊發(fā)表多篇論文。
黃丹陽,中國人民大學(xué)統(tǒng)計(jì)學(xué)院副教授,中國人民大學(xué)杰出青年學(xué)者,北京大數(shù)據(jù)協(xié)會(huì)理事會(huì)副秘書長、常務(wù)理事,全國工業(yè)統(tǒng)計(jì)學(xué)教學(xué)研究會(huì)青年統(tǒng)計(jì)學(xué)家協(xié)會(huì)理事。主持國家自然科學(xué)基金,北京市社會(huì)科學(xué)基金等多項(xiàng)科研課題,曾獲北京市優(yōu)秀人才培養(yǎng)資助。長期從事復(fù)雜網(wǎng)絡(luò)建模、大型網(wǎng)絡(luò)計(jì)算、超高維數(shù)據(jù)分析等方向的理論研究工作。在國內(nèi)外權(quán)威期刊Journal of the American Statistical Association,Journal of Econometrics,Journal of Business and Economic Statistics,以及《統(tǒng)計(jì)研究》《管理世界》等發(fā)表多篇論文。
李偉,中國人民大學(xué)統(tǒng)計(jì)學(xué)院副教授,中國人民大學(xué)吳玉章青年學(xué)者,入選國家高層次青年人才計(jì)劃,中國現(xiàn)場統(tǒng)計(jì)研究會(huì)因果推斷分會(huì)副秘書長。主持國家自然科學(xué)基金青年科學(xué)基金項(xiàng)目、北京市自然科學(xué)基金面上項(xiàng)目等多項(xiàng)課題,參與國家重點(diǎn)研發(fā)計(jì)劃青年科學(xué)家項(xiàng)目。研究方向是因果推斷、缺失數(shù)據(jù)、高維統(tǒng)計(jì)及其在生物醫(yī)學(xué)、社會(huì)經(jīng)濟(jì)學(xué)等領(lǐng)域中的應(yīng)用。在Journal of the Royal Statistical Society Series B,Biometrika, Journal of Econometrics,Biometrics等國際統(tǒng)計(jì)學(xué)期刊發(fā)表多篇論文。
第1章 統(tǒng)計(jì)量
1.1 數(shù)據(jù)和變量
1.1.1 數(shù)據(jù)的例子
1.1.2 變量的類型
批判性思考
習(xí)題1.1
1.2 總體、樣本和統(tǒng)計(jì)量
1.2.1 總體和分布
1.2.2 樣本
1.2.3 統(tǒng)計(jì)量
批判性思考
習(xí)題 1.2
1.3 從樣本認(rèn)識總體的圖表方法
13.1 頻數(shù)頻率表與直方圖
1.3.2 餅圖與條形圖
13.3 樣本的經(jīng)驗(yàn)分布函數(shù)
13.4 高維數(shù)據(jù)的圖表展示方法
13.5 數(shù)據(jù)變換
批判性思考
習(xí)題 1.3
1.4 抽樣分布
1.4.1 樣本均值的抽樣分布
1.4.2 正態(tài)總體各統(tǒng)計(jì)量的分布
1.4.3 用隨機(jī)模擬法尋找統(tǒng)計(jì)量的近似分布
批判性思考
習(xí)題 1.4
1.5 次序統(tǒng)計(jì)量
1.5.1 次序統(tǒng)計(jì)量的概念
1.5.2 樣本極差
1.5.3 樣本中位數(shù)與樣本 p分位數(shù)
1.5.4 箱線圖和 Q-Q圖
1.5.5 次序統(tǒng)計(jì)量的分布
批判性思考
習(xí)題 1.5
1.6 充分統(tǒng)計(jì)量
1.6.1 充分統(tǒng)計(jì)量的概念
1.6.2 因子分解定理
批判性思考
習(xí)題1.6
1.7 常用的概率分布族
1.7.1 常用的概率分布族表
1.7.2 伽馬分布族
1.7.3 貝塔分布族
1.7.4 指數(shù)型分布族
批判性思考
習(xí)題 1.7
18 與本章相關(guān)的 R語言操作
1.8.1 基本統(tǒng)計(jì)量的計(jì)算
1.8.2 圖表
1.8.3 隨機(jī)模擬統(tǒng)計(jì)量的抽樣分布
第2章 參數(shù)估計(jì)
2.1 點(diǎn)估計(jì)與無偏性
批判性思考
習(xí)題 2.1
2.2 矩估計(jì)與相合性
2.2.1 矩估計(jì)
2.2.2 相合性
批判性思考
習(xí)題 2.2
2.3 最大似然估計(jì)與漸近正態(tài)性
2.3.1 最大似然估計(jì)
2.3.2 最大似然估計(jì)的不變原理
2.3.3 最大似然估計(jì)的漸近正態(tài)性
2.3.4 EM 算法
批判性思考
習(xí)題 2.3
2.4 最小方差無偏估計(jì)
2.4.1 無偏估計(jì)的有效性
2.4.2 有偏估計(jì)的均方誤差準(zhǔn)則
2.4.3 一致最小方差無偏估計(jì)
2.4.4 完備性及其應(yīng)用
批判性思考
習(xí)題 2.4
2.5 C-R 不等式
2.5.1 C-R 不等式簡介
2.5.2 有效估計(jì)
批判性思考
習(xí)題 2.5
2.6 置信區(qū)間
2.6.1 置信區(qū)間的概念
2.6.2 樞軸量法
2.6.3 大樣本置信區(qū)間
批判性思考
習(xí)題 2.6
2.7 正態(tài)總體參數(shù)的置信區(qū)間
2.7.1 一維參數(shù)的置信區(qū)間
2.7.2 二維參數(shù)(μ,?)的置信域
2.7.3 樣本量的確定
批判性思考
習(xí)題 2.7
2.8 與本章相關(guān)的 R語言操作
2.8.1 隨機(jī)變量序列分布的演示
2.8.2 最大似然估計(jì)
2.8.3 EM算法模擬實(shí)例
2.8.4 區(qū)間估計(jì)的模擬結(jié)果
2.8.5 均值、方差的區(qū)間估計(jì)
第3章 假設(shè)檢驗(yàn)
3.1 假設(shè)檢驗(yàn)的概念與步驟
3.1.1 假設(shè)檢驗(yàn)問題
3.1.2 假設(shè)檢驗(yàn)的步驟
3.1.3 勢函數(shù)
批判性思考
習(xí)題 3.1
3.2 正態(tài)總體參數(shù)和比率的檢驗(yàn)
3.2.1 正態(tài)均值p的檢驗(yàn)
3.2.2 其他正態(tài)總體參數(shù)的檢驗(yàn)
3.2.3 成對數(shù)據(jù)t檢驗(yàn)
3.2.4 比率的檢驗(yàn)
3.2.5 控制犯兩類錯(cuò)誤的概率,確定樣本量
3.2.6 幾點(diǎn)說明
批判性思考
習(xí)題 3.2
3.3 廣義似然比檢驗(yàn)
3.3.1 廣義似然比檢驗(yàn)簡介
3.3.2 區(qū)分兩個(gè)分布的廣義似然比檢驗(yàn)
批判性思考
習(xí)題 3.3
3.4 分布的檢驗(yàn)
3.4.1 離散分布的 x?擬合優(yōu)度檢驗(yàn)
3.4.2 連續(xù)分布的檢驗(yàn)
批判性思考
習(xí)題 3.4
3.5 大規(guī)模假設(shè)檢驗(yàn)與 FDR
3.5.1 大規(guī)模假設(shè)檢驗(yàn)
3.5.2 FDR 方法介紹
批判性思考
習(xí)題 3.5
3.6 與本章相關(guān)的 R語言操作
3.6.1 正態(tài)總體的參數(shù)檢驗(yàn)
3.6.2 比率檢驗(yàn)
3.6.3 假設(shè)檢驗(yàn)的一個(gè)人為例子
3.6.4 x?擬合優(yōu)度檢驗(yàn)
3.6.5 夏皮羅-維爾克檢驗(yàn)
3.6.6 柯爾莫哥洛夫-斯米爾諾夫檢驗(yàn)
3.6.7 FDR的例子
第4章 統(tǒng)計(jì)決策與貝葉斯方法
4.1 統(tǒng)計(jì)決策的基本概念
4.1.1 統(tǒng)計(jì)決策問題的三要素
4.1.2 統(tǒng)計(jì)決策函數(shù)與風(fēng)險(xiǎn)函數(shù)
批判性思考
習(xí)題 4.1
4.2 貝葉斯點(diǎn)估計(jì)
4.2.1 先驗(yàn)分布與貝葉斯公式
4.2.2 先驗(yàn)分布
4.2.3 貝葉斯風(fēng)險(xiǎn)與貝葉斯點(diǎn)估計(jì)
4.2.4 兩個(gè)注釋
批判性思考
習(xí)題 4.2
4.3 貝葉斯區(qū)間估計(jì)
43.1 可信區(qū)間
43.2 最大后驗(yàn)密度可信區(qū)間
批判性思考
習(xí)題 4.3
4.4 貝葉斯假設(shè)檢驗(yàn)
批判性思考
習(xí)題 4.4
4.5 MCMC 算法
4.5.1 M-H 算法
4.5.2 Gibbs 抽樣
批判性思考
習(xí)題 4.5
4.6 與本章相關(guān)的 R語言操作
4.6.1 不同先驗(yàn)的對比
4.6.2 貝葉斯區(qū)間估計(jì)
4.6.3 M-H算法:例4.5.1、例4.5.2 的代碼實(shí)現(xiàn)
4.6.4 例4.5.3的代碼實(shí)現(xiàn)
4.6.5 Gibbs 抽樣:例4.5.4的代碼實(shí)現(xiàn)
第5章 再抽樣方法
5.1 自助法參數(shù)估計(jì)
5.1.1 標(biāo)準(zhǔn)誤差的自助法估計(jì)
5.1.2 偏差的自助法估計(jì)
5.1.3 自助法的區(qū)間估計(jì)
5.1.4 討論
批判性思考
習(xí)題 5.1
5.2 刀切法
5.2.1 刀切法介紹
5.2.2 刀切法和自助法的聯(lián)系
批判性思考
習(xí)題 5.2
5.3 再抽樣假設(shè)檢驗(yàn)
5.3.1 置換檢驗(yàn)
5.3.2 自助法假設(shè)檢驗(yàn)
批判性思考
習(xí)題 53
5.4 交叉驗(yàn)證
5.4.1 交叉驗(yàn)證簡介
5.4.2 進(jìn)一步的討論
批判性思考
習(xí)題 5.4
5.5 數(shù)據(jù)科學(xué)中的 PCS準(zhǔn)則
5.5.1 DSLC 中的 PCS 準(zhǔn)則
5.5.2 通過擾動(dòng)分析進(jìn)行 PCS推斷
補(bǔ)充知識
批判性思考
習(xí)題 5.5
5.6 與本章相關(guān)的 R語言操作
5.6.1 自助法
5.6.2 刀切法
5.6.3 假設(shè)檢驗(yàn)
5.6.4 交叉驗(yàn)證
5.6.5 數(shù)據(jù)科學(xué)中的 PCS 準(zhǔn)則
附錄 R語言基礎(chǔ)
A.1 R語言簡介
A.1.1 R語言概述
A.1.2 R語言的安裝
A.2 數(shù)據(jù)的類型結(jié)構(gòu)
A.2.1 數(shù)據(jù)的類型
A.2.2 數(shù)據(jù)的結(jié)構(gòu)
A.2.3 缺失數(shù)據(jù)的處理
A.3 R語言的基本操作
A.3.1 數(shù)據(jù)的輸入和輸出
A.3.2 控制結(jié)構(gòu)
A.3.3 自定義函數(shù)
A.3.4 畫圖
A.4 概率分布
參考文獻(xiàn)