基因表達(dá)譜數(shù)據(jù)挖掘的粒計(jì)算方法與應(yīng)用
基因表達(dá)譜數(shù)據(jù)挖掘是生物信息學(xué)領(lǐng)域的重要研究內(nèi)容之一,發(fā)展高效實(shí)用的基因表達(dá)譜數(shù)據(jù)處理技術(shù)有助于挖掘重要的腫瘤基因信息,對腫瘤的早期發(fā)現(xiàn)、臨床診斷與治療以及疾病預(yù)防具有非常重要的科學(xué)意義和實(shí)際價(jià)值。粒計(jì)算是當(dāng)前人工智能領(lǐng)域中模擬人類思維和解決復(fù)雜問題的新理論與新方法,它涵蓋了所有有關(guān)粒度的理論、方法和技術(shù),是研究大規(guī)模復(fù)雜問題求解、大數(shù)據(jù)分析與挖掘、不確定性信息處理的有力工具。由此,如何高效地從大規(guī)模復(fù)雜高維的基因表達(dá)譜數(shù)據(jù)中迅速挖掘數(shù)據(jù)之間的潛在關(guān)系,已成為粒計(jì)算研究知識獲取技術(shù)的關(guān)鍵問題。《基因表達(dá)譜數(shù)據(jù)挖掘的粒計(jì)算方法與應(yīng)用》介紹了基因表達(dá)譜數(shù)據(jù)挖掘的粒計(jì)算方法與應(yīng)用的*新進(jìn)展,內(nèi)容涉及基因表達(dá)譜數(shù)據(jù)挖掘的相關(guān)技術(shù)、粒計(jì)算的相關(guān)理論、基于鄰域熵的腫瘤基因選擇方法、基于鄰域互信息的腫瘤基因選擇方法、基于監(jiān)督學(xué)習(xí)和粒計(jì)算的腫瘤基因選擇方法。
更多科學(xué)出版社服務(wù),請掃碼獲取。
目錄
前言
第1章 基因表達(dá)譜數(shù)據(jù)挖掘的相關(guān)技術(shù) 1
1.1 引言 1
1.2 基因表達(dá)譜數(shù)據(jù) 3
1.2.1 基因表達(dá)譜數(shù)據(jù)的表示 3
1.2.2 基因表達(dá)譜數(shù)據(jù)的特點(diǎn) 4
1.2.3 基因表達(dá)譜數(shù)據(jù)的數(shù)學(xué)描述 5
1.3 特征選擇 6
1.3.1 基因表達(dá)譜數(shù)據(jù)的特征選擇 6
1.3.2 基于過濾法的特征選擇 7
1.3.3 基于封裝法的特征選擇 8
1.3.4 基于嵌入法的特征選擇 8
1.3.5 搜索策略 9
1.4 評價(jià)標(biāo)準(zhǔn)與指標(biāo) 10
1.5 小結(jié) 12
參考文獻(xiàn) 12
第2章 粒計(jì)算的相關(guān)理論 18
2.1 粒計(jì)算的基本概念 18
2.2 粗糙集理論 20
2.3 模糊集理論 30
2.4 鄰域粗糙集 37
2.5 粗糙模糊集 39
2.6 多粒度粗糙集 43
2.7 信息熵度量 47
2.8 鄰域熵度量 70
2.9 小結(jié) 73
參考文獻(xiàn) 74
第3章 基于鄰域熵的腫瘤基因選擇方法 82
3.1 基于鄰域熵不確定性度量的腫瘤基因選擇方法 82
3.1.1 引言 82
3.1.2 可信度與覆蓋度 82
3.1.3 基于決策鄰域熵的不確定性度量 84
3.1.4 啟發(fā)式非單調(diào)特征選擇模型 86
3.1.5 基于決策鄰域熵的腫瘤基因選擇算法 89
3.1.6 實(shí)驗(yàn)結(jié)果與分析 91
3.1.7 小結(jié) 104
3.2 基于鄰域近似決策熵的腫瘤基因數(shù)據(jù)的特征選擇方法 104
3.2.1 引言 104
3.2.2 鄰域近似精度 105
3.2.3 鄰域近似決策熵 106
3.2.4 基于鄰域近似決策熵的特征選擇算法 108
3.2.5 算法計(jì)算復(fù)雜度分析 109
3.2.6 實(shí)驗(yàn)結(jié)果與分析 109
3.2.7 小結(jié) 116
3.3 基于Lebesgue測度和鄰域熵的鄰域粗糙集特征選擇方法 116
3.3.1 引言 116
3.3.2 基于Lebesgue測度的不確定性度量 117
3.3.3 基于鄰域熵的不確定性度量 117
3.3.4 基于鄰域粗糙聯(lián)合熵的特征選擇 119
3.3.5 特征選擇算法 119
3.3.6 實(shí)驗(yàn)結(jié)果與分析 121
3.3.7 小結(jié) 127
3.4 基于Lebesgue測度和熵度量的不完備鄰域系統(tǒng)特征選擇方法 127
3.4.1 引言 127
3.4.2 不完備鄰域決策系統(tǒng)的Lebesgue測度 128
3.4.3 基于鄰域容差熵的不確定性度量 129
3.4.4 基于鄰域容差依賴聯(lián)合熵的特征選擇 130
3.4.5 不完備鄰域決策系統(tǒng)特征選擇算法 131
3.4.6 實(shí)驗(yàn)結(jié)果與分析 132
3.4.7 小結(jié) 139
3.5 基于Lebesgue測度和熵度量的鄰域多粒度粗糙集特征選擇方法 140
3.5.1 引言 140
3.5.2 鄰域多粒度粗糙集 140
3.5.3 鄰域多粒度粗糙集中基于Lebesgue測度的不確定性度量 142
3.5.4 基于鄰域多粒度熵的不確定性度量 143
3.5.5 基于悲觀鄰域多粒度依賴聯(lián)合熵的特征選擇算法 144
3.5.6 實(shí)驗(yàn)結(jié)果與分析 146
3.5.7 小結(jié) 152
3.6 基于模糊鄰域條件熵的基因選擇方法 152
3.6.1 引言 152
3.6.2 模糊鄰域關(guān)系 153
3.6.3 模糊鄰域粒和模糊決策 154
3.6.4 模糊鄰域條件熵 157
3.6.5 基于模糊鄰域條件熵的基因選擇算法 159
3.6.6 實(shí)驗(yàn)結(jié)果與分析 160
3.6.7 小結(jié) 163
參考文獻(xiàn) 163
第4章 基于鄰域互信息的腫瘤基因選擇方法 171
4.1 基于鄰域互信息和粒子群優(yōu)化的腫瘤基因選擇方法 171
4.1.1 引言 171
4.1.2 粒子群優(yōu)化 171
4.1.3 鄰域互信息 172
4.1.4 基于鄰域互信息的Relief算法 173
4.1.5 基于鄰域粗糙集和粒子群優(yōu)化的基因選擇算法 174
4.1.6 實(shí)驗(yàn)結(jié)果與分析 175
4.1.7 小結(jié) 177
4.2 基于鄰域互信息和自組織映射的基因選擇方法 177
4.2.1 引言 177
4.2.2 自組織映射 178
4.2.3 獲勝神經(jīng)元 179
4.2.4 特征重要性系數(shù) 179
4.2.5 基于鄰域互信息和自組織映射的基因選擇算法 179
4.2.6 實(shí)驗(yàn)結(jié)果與分析 180
4.2.7 小結(jié) 181
4.3 基于鄰域互信息和模糊C均值聚類的基因選擇方法 181
4.3.1 引言 181
4.3.2 模糊C均值聚類 182
4.3.3 基于鄰域互信息的特征內(nèi)聚度和特征間的鄰域耦合度 183
4.3.4 FCM聚類中心初始化算法 184
4.3.5 基于鄰域互信息和模糊C均值聚類的基因選擇算法 184
4.3.6 實(shí)驗(yàn)結(jié)果與分析 185
4.3.7 小結(jié) 187
4.4 基于鄰域條件互信息的腫瘤基因選擇方法 188
4.4.1 引言 188
4.4.2 鄰域條件互信息 188
4.4.3 基于鄰域互信息的基因選擇 189
4.4.4 基于鄰域條件互信息的基因選擇 189
4.4.5 實(shí)驗(yàn)結(jié)果與分析 190
4.4.6 小結(jié) 191
參考文獻(xiàn) 191
第5章 基于監(jiān)督學(xué)習(xí)和粒計(jì)算的腫瘤基因選擇方法 196
5.1 基于Fisher線性判別和鄰域依賴度的基因選擇方法 196
5.1.1 引言 196
5.1.2 Fisher線性判別 197
5.1.3 鄰域依賴度 198
5.1.4 基于FLD和鄰域依賴度的腫瘤基因選擇算法 198
5.1.5 實(shí)驗(yàn)結(jié)果與分析 200
5.1.6 小結(jié) 202
5.2 基于信噪比與鄰域粗糙集的基因選擇方法 202
5.2.1 引言 202
5.2.2 信噪比 203
5.2.3 信噪比值區(qū)間劃分 204
5.2.4 基于信噪比與鄰域粗糙集的基因選擇算法 204
5.2.5 實(shí)驗(yàn)結(jié)果與分析 206
5.2.6 小結(jié) 208
5.3 基于統(tǒng)計(jì)特性的鄰域粗糙集腫瘤基因選擇方法 208
5.3.1 引言 208
5.3.2 信息基因重要度 209
5.3.3 基因相關(guān)性度量函數(shù) 210
5.3.4 基于統(tǒng)計(jì)特性的鄰域粗糙集腫瘤基因選擇算法 213
5.3.5 實(shí)驗(yàn)結(jié)果與分析 215
5.3.6 小結(jié) 216
5.4 基于信息增益與鄰域粗糙集的基因選擇方法 216
5.4.1 引言 216
5.4.2 斯皮爾曼秩相關(guān)系數(shù) 217
5.4.3 信息增益 217
5.4.4 腫瘤基因數(shù)據(jù)預(yù)處理 218
5.4.5 基于信息增益和鄰域粗糙集的腫瘤基因選擇算法 218
5.4.6 實(shí)驗(yàn)結(jié)果與分析 219
5.4.7 小結(jié) 221
5.5 基于PCA和多鄰域粗糙集的腫瘤基因選擇方法 222
5.5.1 引言 222
5.5.2 主成分分析 222
5.5.3 主成分分析預(yù)處理 223
5.5.4 多鄰域粗糙集 223
5.5.5 基于主成分分析和多鄰域粗糙集的腫瘤基因選擇算法 224
5.5.6 實(shí)驗(yàn)結(jié)果與分析 226
5.5.7 小結(jié) 227
5.6 基于logistic與相關(guān)信息熵的基因選擇方法 228
5.6.1 引言 228
5.6.2 logistic回歸模型與信息熵 229
5.6.3 二項(xiàng)logistic回歸模型 229
5.6.4 相關(guān)信息熵 230
5.6.5 基于logistic和相關(guān)信息熵的基因選擇算法 230
5.6.6 實(shí)驗(yàn)結(jié)果與分析 232
5.6.7 小結(jié) 233
參考文獻(xiàn) 233