材料數(shù)據(jù)挖掘方法與應(yīng)用
《材料數(shù)據(jù)挖掘方法與應(yīng)用》詳細(xì)介紹了材料數(shù)據(jù)挖掘的研究背景、常用方法、具體步驟和作者團(tuán)隊(duì)自主開發(fā)的在線計(jì)算平臺(tái)OCPMDM(online computation platform for materials data mining,http:/materials-data-mining.com/ocpmdm/)的應(yīng)用,重點(diǎn)闡述了OCPMDM在線計(jì)算平臺(tái)在材料設(shè)計(jì)(鈣鈦礦型材料、染料敏化太陽能電池材料等)和化工優(yōu)化(氟橡膠工藝優(yōu)化等)中的應(yīng)用。本書方便讀者學(xué)以致用,讀者可以免費(fèi)利用OCPMDM軟件平臺(tái),構(gòu)建并分享材料數(shù)據(jù)挖掘模型,用于虛擬樣本的高通量篩選,加快新材料研發(fā)進(jìn)程。
本書可供材料科學(xué)與工程等相關(guān)領(lǐng)域科研人員和工程技術(shù)人員閱讀,亦可作為高等院校材料數(shù)據(jù)挖掘研究方向師生的教學(xué)參考書。
第1章 材料數(shù)據(jù)挖掘綜述 001
1.1 材料數(shù)據(jù)挖掘的研究背景 001
1.1.1 材料數(shù)據(jù)挖掘與材料設(shè)計(jì) 004
1.1.2 材料數(shù)據(jù)挖掘與材料信息學(xué) 006
1.1.3 材料數(shù)據(jù)挖掘與材料基因組工程 008
1.1.4 材料數(shù)據(jù)挖掘與材料工業(yè)優(yōu)化 011
1.2 材料數(shù)據(jù)挖掘方法概要 012
1.2.1 材料數(shù)據(jù)挖掘問題的數(shù)學(xué)表達(dá) 013
1.2.2 材料數(shù)據(jù)挖掘模型的“過擬合”和“欠擬合”問題 013
1.2.3 材料數(shù)據(jù)挖掘的常用方法 015
1.2.4 材料數(shù)據(jù)挖掘的基本流程 019
1.3 材料數(shù)據(jù)挖掘應(yīng)用進(jìn)展 021
1.4 材料數(shù)據(jù)挖掘發(fā)展趨勢 023
參考文獻(xiàn) 025
第2章 回歸分析 029
2.1 回歸分析方法概論 029
2.2 線性回歸 030
2.2.1 一元線性回歸 030
2.2.2 多元線性回歸 032
2.2.3 違背基本假設(shè)的情況與處理 033
2.3 嶺回歸 034
2.4 套索算法 036
2.5 偏最小二乘回歸 038
2.6 邏輯回歸 040
參考文獻(xiàn) 042
第3章 統(tǒng)計(jì)模式識(shí)別 043
3.1 統(tǒng)計(jì)模式識(shí)別概論 043
3.2 最近鄰 045
3.3 主成分分析 046
3.4 多重判別矢量和費(fèi)歇爾判別矢量 048
3.5 非線性映照 052
3.6 模式識(shí)別應(yīng)用技術(shù) 053
3.6.1 最佳投影識(shí)別 054
3.6.2 超多面體建模 056
3.6.3 逐級(jí)投影建模 056
3.6.4 最佳投影回歸 058
3.6.5 模式識(shí)別逆投影 061
參考文獻(xiàn) 062
第4章 決策樹 063
4.1 決策樹概論 063
4.2 決策樹 064
4.3 隨機(jī)決策樹 066
4.4 隨機(jī)森林 067
4.5 梯度提升決策樹 069
4.6 極限梯度提升算法 071
4.7 快速梯度提升算法 074
參考文獻(xiàn) 076
第5章 聚類方法 077
5.1 k均值聚類方法 077
5.2 噪聲密度聚類方法 078
5.3 評(píng)估指標(biāo) 079
參考文獻(xiàn) 081
第6章 人工神經(jīng)網(wǎng)絡(luò) 082
6.1 反向人工神經(jīng)網(wǎng)絡(luò) 083
6.2 Kohonen自組織網(wǎng)絡(luò) 085
參考文獻(xiàn) 086
第7章 遺傳算法和遺傳回歸 087
7.1 遺傳算法 087
7.2 遺傳回歸 089
參考文獻(xiàn) 092
第8章 支持向量機(jī)方法 094
8.1 統(tǒng)計(jì)學(xué)習(xí)理論簡介 095
8.1.1 背景 095
8.1.2 原理 095
8.2 支持向量分類算法 097
8.2.1 線性可分情形 097
8.2.2 非線性可分情形 098
8.3 支持向量機(jī)的核函數(shù) 099
8.4 支持向量回歸方法 101
8.4.1 線性回歸情形 101
8.4.2 非線性回歸情形 102
8.5 支持向量機(jī)分類與回歸算法的實(shí)現(xiàn) 103
8.6 應(yīng)用前景 104
參考文獻(xiàn) 105
第9章 集成學(xué)習(xí)方法 107
9.1 集成學(xué)習(xí)算法概述 107
9.2 Boosting算法 110
9.3 AdaBoost算法 111
9.4 Bagging算法 113
參考文獻(xiàn) 114
第10章 特征選擇方法和應(yīng)用 116
10.1 特征變量篩選方法概論 116
10.2 過濾式 118
10.2.1 方差選擇法 118
10.2.2 相關(guān)系數(shù)法 118
10.2.3 最大信息系數(shù) 119
10.2.4 最大相關(guān)最小冗余 120
10.2.5 卡方檢驗(yàn) 121
10.2.6 Relief 121
10.3 封裝式 122
10.3.1 全局最優(yōu)搜索 122
10.3.2 啟發(fā)式搜索 123
10.3.3 隨機(jī)搜索 124
10.4 嵌入式 124
10.5 小結(jié) 125
參考文獻(xiàn) 126
第11章 材料數(shù)據(jù)挖掘在線計(jì)算平臺(tái) 128
11.1 材料數(shù)據(jù)挖掘在線計(jì)算平臺(tái)技術(shù)簡介 128
11.1.1 OCPMDM平臺(tái)架構(gòu) 129
11.1.2 OCPMDM平臺(tái)技術(shù)簡介 130
11.1.3 分布式計(jì)算簡介與使用 131
11.2 材料數(shù)據(jù)挖掘在線計(jì)算平臺(tái)功能介紹 132
11.2.1 機(jī)器學(xué)習(xí)算法 133
11.2.2 材料描述符填充 134
11.2.3 數(shù)據(jù)特征篩選 134
11.2.4 智能建模 135
11.2.5 鈣鈦礦材料高通量虛擬篩選 135
11.2.6 模型分享 135
11.3 材料數(shù)據(jù)挖掘在線計(jì)算平臺(tái)應(yīng)用案例 136
11.3.1 數(shù)據(jù)來源 136
11.3.2 研究流程 137
11.3.3 結(jié)果與討論 137
11.4 小結(jié) 145
參考文獻(xiàn) 146
第12章 鈣鈦礦型材料的數(shù)據(jù)挖掘 148
12.1 鈣鈦礦型材料數(shù)據(jù)挖掘概論 148
12.2 鈣鈦礦型材料居里溫度的數(shù)據(jù)挖掘 149
12.2.1 數(shù)據(jù)集 150
12.2.2 特征變量篩選 151
12.2.3 參數(shù)優(yōu)化 152
12.2.4 模型的評(píng)價(jià) 154
12.2.5 模型的檢驗(yàn) 156
12.2.6 虛擬篩選 156
12.3 鈣鈦礦型材料比表面積的數(shù)據(jù)挖掘 158
12.3.1 數(shù)據(jù)集 159
12.3.2 特征變量篩選 160
12.3.3 SVR模型的建立與留一法檢驗(yàn) 162
12.3.4 與其他算法的結(jié)果比較 165
12.3.5 SVR外部測試集驗(yàn)證 165
12.3.6 高通量篩選 167
12.3.7 模型分享 169
12.3.8 模型的模式識(shí)別解釋 169
12.3.9 模型的敏感性分析 170
12.4 小結(jié) 172
參考文獻(xiàn) 173
第13章 染料敏化太陽能電池材料的數(shù)據(jù)挖掘 176
13.1 概述 176
13.1.1 染料敏化太陽能電池 176
13.1.2 染料敏化劑及其數(shù)據(jù)挖掘研究現(xiàn)狀 177
13.1.3 N-P類敏化劑研究現(xiàn)狀 179
13.2 N-P類敏化劑的數(shù)據(jù)挖掘 179
13.2.1 數(shù)據(jù)集與特征變量的計(jì)算 180
13.2.2 特征變量的篩選和建模 181
13.2.3 模型的驗(yàn)證 184
13.3 分子設(shè)計(jì)與性能預(yù)報(bào) 185
13.3.1 特征變量的解釋 185
13.3.2 分子設(shè)計(jì)與PCE預(yù)報(bào) 187
13.4 量化驗(yàn)證 189
13.4.1 計(jì)算方法 189
13.4.2 電子結(jié)構(gòu) 191
13.4.3 吸收光譜 194
13.4.4 染料和TiO2絡(luò)合物 195
13.4.5 綜合效率 196
13.5 小結(jié) 199
參考文獻(xiàn) 200
第14章 高分子材料的數(shù)據(jù)挖掘 204
14.1 概述 204
14.1.1 高分子材料數(shù)據(jù)挖掘研究現(xiàn)狀 205
14.1.2 高分子指紋描述符 206
14.2 高分子材料設(shè)計(jì)算法 207
14.2.1 遺傳算法 207
14.2.2 貝葉斯算法 208
14.3 高分子禁帶寬度的數(shù)據(jù)挖掘 210
14.3.1 研究背景 210
14.3.2 數(shù)據(jù)集 210
14.3.3 DFT方法探索 211
14.3.4 特征變量篩選 212
14.3.5 模型篩選 212
14.3.6 SVC模型的建立與驗(yàn)證 215
14.3.7 特征相關(guān)性分析 216
14.3.8 特征敏感性分析 218
14.3.9 模型分享 219
14.3.10 分子設(shè)計(jì) 219
14.4 小結(jié) 221
參考文獻(xiàn) 221
第15章 基于數(shù)據(jù)挖掘的氟橡膠門尼黏度優(yōu)化控制 223
15.1 研究背景 223
15.2 研究思路 225
15.3 研究內(nèi)容 225
15.4 氟橡膠生產(chǎn)優(yōu)化控制軟件BDMOS介紹 227
15.5 BDMOS軟件具體功能 228
15.5.1 數(shù)據(jù)導(dǎo)入 228
15.5.2 統(tǒng)計(jì)信息 230
15.5.3 變量重要性分析 234
15.5.4 數(shù)據(jù)挖掘模型 234
15.6 氟橡膠簡介 239
15.7 氟橡膠生產(chǎn)數(shù)據(jù)挖掘 242
15.7.1 數(shù)據(jù)集收集 242
15.7.2 模型建立 245
15.7.3 模型檢驗(yàn) 246
15.8 小結(jié) 248
參考文獻(xiàn) 249
索引 250