基于大數(shù)據(jù)時(shí)代生物醫(yī)學(xué)數(shù)據(jù)的爆炸式增長(zhǎng),本書從醫(yī)學(xué)科研中的實(shí)際問題出發(fā),以案例的形式深入淺出地介紹了近年來嶄新的醫(yī)學(xué)數(shù)據(jù)挖掘技術(shù),包括決策樹模型、支持向量機(jī)、隨機(jī)森林分類、關(guān)聯(lián)規(guī)則、貝葉斯網(wǎng)絡(luò)構(gòu)建等,并詳細(xì)介紹了數(shù)據(jù)挖掘軟件(SPSS、SAS、R等)的操作步驟,重點(diǎn)突出實(shí)用性和可操作性,以期提高讀者對(duì)醫(yī)學(xué)科研數(shù)據(jù)的深層次處理與分析的能力。
本書主要取材于編者近年來從事生物醫(yī)學(xué)數(shù)據(jù)深度挖掘方面的研究與教學(xué)工作內(nèi)容,既適用于醫(yī)學(xué)院校本科生及研究生、醫(yī)學(xué)基礎(chǔ)及臨床科研工作者和相關(guān)技術(shù)人員作為教材,也可作為科學(xué)研究的參考用書。
第1章 數(shù)據(jù)預(yù)處理 1
1.1 異常值的常見處理方法 1
1.2 缺失值的填補(bǔ) 8
第2章 多元線性回歸分析 14
2.1 多元線性回歸的概念 14
2.2 多元線性回歸的模型結(jié)構(gòu) 14
2.3 多元逐步線性回歸 17
第3章 Logistic回歸分析 22
3.1 Logistic回歸分析的基本概念 22
3.2 Logistic回歸的模型結(jié)構(gòu) 22
3.3 應(yīng)用實(shí)例1:一般資料的Logistic回歸 23
3.4 應(yīng)用實(shí)例2:列聯(lián)表資料的Logistic回歸 27
3.5 應(yīng)用實(shí)例3:多項(xiàng)Logistic回歸分析 29
第4章 非線性回歸擬合分析 32
4.1 非線性回歸基本概念 32
4.2 應(yīng)用實(shí)例1:對(duì)新增SARS病例數(shù)的預(yù)測(cè)分析 32
4.3 應(yīng)用實(shí)例2:對(duì)累計(jì)SARS病例數(shù)的預(yù)測(cè)分析 37
第5章 生存分析 41
5.1 生存分析的基本概念 41
5.2 生存分析的資料特點(diǎn) 41
5.3 生存資料的分析方法 42
5.4 應(yīng)用實(shí)例1:累積生存率的計(jì)算 42
5.5 應(yīng)用實(shí)例2:小樣本生存率的Kaplan-Meier估計(jì) 45
5.6 應(yīng)用實(shí)例3:生存曲線比較的Log-rank檢驗(yàn) 47
5.7 應(yīng)用實(shí)例4:Cox回歸 51
5.7.1 Cox模型結(jié)構(gòu)與參數(shù)估計(jì) 51
5.7.2 應(yīng)用實(shí)例:Cox回歸分析 51
第6章 基于競(jìng)爭(zhēng)風(fēng)險(xiǎn)模型的生存分析 56
6.1 競(jìng)爭(zhēng)風(fēng)險(xiǎn)模型 56
6.2 應(yīng)用實(shí)例:競(jìng)爭(zhēng)風(fēng)險(xiǎn)模型的生存分析 56
第7章 Meta分析 62
7.1 Meta分析概述 62
7.2 Meta分析的方法與步驟 62
7.3 應(yīng)用實(shí)例1:二分類資料的Meta分析 63
7.4 應(yīng)用實(shí)例2:連續(xù)資料的Meta分析 71
第8章 劑量-反應(yīng)模型的Meta分析 77
8.1 劑量-反應(yīng)關(guān)系的數(shù)據(jù)結(jié)構(gòu) 77
8.2 線性擬合 78
8.3 非線性擬合-三次曲線擬合 79
第9章 決策樹模型分析 82
9.1 分類的概念 82
9.2 分類的步驟 82
9.3 分類器性能的評(píng)估 83
9.4 決策樹分類器簡(jiǎn)介 83
9.5 應(yīng)用實(shí)例:決策樹分析 85
第10章 隨機(jī)森林法提取特征屬性 88
10.1 隨機(jī)森林方法基本概念 88
10.2 基于平均基尼指數(shù)減少量的特征屬性選擇 88
10.3 應(yīng)用實(shí)例:隨機(jī)森林法提取特征屬性 90
第11章 傾向性得分匹配方法 94
11.1 傾向性得分匹配方法 94
11.2 傾向性得分匹配方法的步驟 94
11.3 應(yīng)用實(shí)例:傾向性得分匹配 95
第12章 用廣義估計(jì)方程分析重復(fù)測(cè)量的定性資料 102
12.1 廣義估計(jì)方程的基本概念 102
12.2 廣義線性模型的結(jié)構(gòu) 102
12.3 GEE算法 103
12.4 應(yīng)用實(shí)例1:重復(fù)測(cè)量的實(shí)驗(yàn)數(shù)據(jù) 103
12.5 應(yīng)用實(shí)例2:?jiǎn)柧碚{(diào)查中的多選題數(shù)據(jù) 105
第13章 基于支持向量機(jī)的微陣列數(shù)據(jù)分類 109
13.1 支持向量機(jī)簡(jiǎn)介 109
13.2 支持向量機(jī)的基本原理 109
13.3 應(yīng)用實(shí)例:支持向量機(jī)分類 111
第14章 時(shí)間序列分析 113
14.1 時(shí)間序列分析的基本概念 113
14.2 時(shí)間序列分析的主要步驟 113
14.3 應(yīng)用實(shí)例:時(shí)間序列分析 114
第15章 路徑圖分析 118
15.1 路徑圖分析基本理論 118
15.2 路徑圖分析的基本步驟 118
15.3 應(yīng)用實(shí)例:路徑圖分析 119
15.3.1 第一個(gè)回歸分析 119
15.3.2 第二個(gè)回歸分析 121
15.3.3 第三個(gè)回歸分析 122
第16章 主成分分析與因子分析 124
16.1 主成分分析概念 124
16.2 應(yīng)用實(shí)例1:主成分分析 124
16.3 因子分析概念 129
16.4 應(yīng)用實(shí)例2:因子分析 129
第17章 判別分析 134
17.1 判別分析的概念 134
17.2 常用的判別分析方法 134
17.3 判別函數(shù)的驗(yàn)證 135
17.4 應(yīng)用實(shí)例:判別分析 135
第18章 聚類分析 144
18.1 聚類分析的概念 144
18.2 K均值聚類法 144
18.3 應(yīng)用實(shí)例1:K均值聚類 145
18.4 系統(tǒng)聚類法 148
18.5 應(yīng)用實(shí)例2:系統(tǒng)聚類 149
18.6 繪制雙向聚類熱圖 153
第19章 關(guān)聯(lián)規(guī)則 156
19.1 關(guān)聯(lián)規(guī)則的基本概念 156
19.2 關(guān)聯(lián)規(guī)則的質(zhì)量和重要性 156
19.3 關(guān)聯(lián)規(guī)則分析的基本方法 157
19.4 應(yīng)用實(shí)例:關(guān)聯(lián)規(guī)則分析 157
第20章 兩組ROC曲線下的面積比較 161
20.1 ROC曲線的構(gòu)建 161
20.2 ROC曲線下面積 162
20.3 兩組ROC曲線下面積比較 162
20.4 應(yīng)用實(shí)例:兩組ROC曲線下面積比較 162
第21章 診斷準(zhǔn)確性試驗(yàn)Meta分析 166
21.1 診斷準(zhǔn)確性試驗(yàn)Meta分析基本概念 166
21.2 診斷準(zhǔn)確性試驗(yàn)Meta分析的相關(guān)評(píng)價(jià)指標(biāo) 166
21.3 應(yīng)用實(shí)例:診斷準(zhǔn)確性試驗(yàn)Meta分析 167
第22章 貝葉斯網(wǎng)絡(luò)分析 173
22.1 貝葉斯網(wǎng)絡(luò)的概念 173
22.2 應(yīng)用實(shí)例:貝葉斯網(wǎng)絡(luò)構(gòu)建 174
第23章 偏最小二乘回歸分析 179
23.1 偏最小二乘回歸的基本步驟和原理 179
23.2 應(yīng)用實(shí)例:偏最小二乘回歸分析 180
參考文獻(xiàn) 185
收起全部↑