《化學信息學》(第二版)是“十二五”普通高等教育本科國家級規(guī)劃教材、普通高等教育“十一五”國家級規(guī)劃教材。本書在第一版的基礎上,著重針對中、外文期刊網(wǎng)絡數(shù)據(jù)庫的檢索過程進行了介紹,并擴充了專利文獻與技術標準數(shù)據(jù)庫的相關內(nèi)容。全書主要分為四大部分,共12章,其中第1章概述了化學信息學的產(chǎn)生及特點;第2~8章講述了化學信息的來源,包括紙質(zhì)版的手冊,書籍,搜索引擎,目前廣為使用的中、外文期刊文獻數(shù)據(jù)庫以及專利文獻與技術標準數(shù)據(jù)庫;第9~11章介紹了化學信息的處理工具(即化學軟件)、處理方法(相關化學計量學算法)以及定量構效關系(QSAR)的原理及應用,并新增了部分例子;在第12章中,對生物信息學領域的研究進行了概述。
《化學信息學》(第二版)可作為高等院校化學、化工及相關專業(yè)本科“化學信息學”課程的入門教材,另外,書中提供了大量與化學信息學相關的網(wǎng)址,亦可作為研究生的參考書籍。
李夢龍,四川大學化學學院,副院長,教授,1978-1990 年于湖南大學分析化學專業(yè)獲理學學士、碩士、博士學位, 1990 年進入四川大學化學學院任教,現(xiàn)為四川大學教授,博士生指導教師,九三學社社員, 教育部高校理科化學教學指導委員會委員、中國化學會化學教育學科委員會委員、中國化學會計算機化學專委會委員、 中國儀器儀表學會分析儀器學會理事、 四川省化學化工學會分析化學專委會副主任,《應用基礎與工程科學學報》編委、《環(huán)境化學》編委 。四川大學教學名師,四川省精品課程《分析化學》負責人。
主要工作業(yè)績:主持完成國家自然科學基金項目、 973 子項目等 5 項,獲部省級成果 2 項,發(fā)表論文 90 余篇,出版專著 4 部,培養(yǎng)碩 博士研究生近40余名。
教學方面:擔任教育部高校理科化學指導委員會委員、中國化學會化學教育委員會成員、計算機化學專業(yè)委員會委員,參與了由教指委承擔的《本科化學專業(yè)規(guī)范》和《本科化學教學質(zhì)量評估》等項目,負責教育部、四川省教改項目4項。主編計算機輔助化學教材《Internet與化學信息導論》、《化學軟件及其應用》、《分析化學數(shù)據(jù)速查手冊》、《元素化學反應速查手冊》,及十一五、十二五國家規(guī)劃教材《化學信息學》;負責四川省精品課程《分析化學》的建設,獲省級教學成果獎2項,并獲得四川大學教學名師稱號。
科研方面:課題組通過多年研究和不斷創(chuàng)新,在化學計量學,化學和生物信息相關的算法和體系研究上取得了較好的成果。如生物分子的結(jié)構功能研究,生物組學分析領域積累了豐富的經(jīng)驗;在臨床數(shù)據(jù)的診斷模型構建以及軟件平臺建設方面積累了豐富的經(jīng)驗。負責了多項國家自然科學基金項目(目前在研2項),在Nucleic Acids Research, SCI Rep, PROTEINS, 以及Chemometrics and Intelligent Laboratory Systems,PLoS系列,BMC 系列, 雜志發(fā)表SCI論文200余篇。
第1章 概述1
1.1什么是化學信息學1
1.2化學信息學的誕生背景1
1.3信息科學在化學領域的應用2
1.4化學信息采集接口2
1.5化學信息的結(jié)構和特點3
1.6化學信息的工作方式4
1.7化學信息學的應用4
1.7.1化合物結(jié)構繪制4
1.7.2化學數(shù)據(jù)庫設計與開發(fā)4
1.7.3化學反應體系模擬5
1.7.4計算機輔助波譜解析5
1.7.5化合物結(jié)構與活性關系預測5
1.7.6實驗室信息管理系統(tǒng)5
1.8展望5
第2章 化學信息來源7
2.1辭典7
2.2手冊7
2.3化學期刊9
2.3.1綜合類期刊10
2.3.2有機化學期刊10
2.3.3分析化學期刊11
2.3.4無機化學期刊12
2.3.5物理化學期刊12
2.4圖書館資源13
2.4.1生命科學圖書館13
2.4.2中國科學院大連化學物理研究所圖書館13
2.4.3中國科學院國家科學圖書館14
2.4.4國家科技圖書文獻中心16
2.4.5清華大學圖書館17
2.4.6中國國家圖書館18
2.4.7哈佛大學圖書館19
2.4.8斯坦福大學圖書館19
2.5化學化工資源信息平臺20
2.5.1化學信息網(wǎng)20
2.5.2Computer Aided Chemistry Tutorial21
2.5.3Wilton High School Chemistry22
擴展閱讀:信息22
第3章 信息搜索引擎23
3.1概述23
3.1.1搜索引擎的原理23
3.1.2搜索引擎的歷史及發(fā)展趨勢24
3.2搜索引擎的定義及分類27
3.2.1全文搜索引擎27
3.2.2目錄索引類搜索引擎27
3.2.3元搜索引擎27
3.2.4垂直搜索引擎28
3.3搜索引擎查詢方法28
3.3.1模糊查詢28
3.3.2精確查詢29
3.3.3邏輯查詢29
3.3.4查詢范圍限制29
3.4常用的全文搜索引擎30
3.4.1百度30
3.4.2Google中國31
3.4.3維基百科31
3.5常用的學術搜索引擎33
3.5.1BASE33
3.5.2SciTech Connect34
3.5.3CiteSeerX35
3.6常用的元搜索引擎35
3.6.1Dogpile35
3.6.2Excite36
3.6.3Ixquick36
3.6.4Mamma37
3.6.5Metacrawler38
3.6.6ProFusion38
3.6.7Savvysearch39
3.7專業(yè)搜索引擎39
3.7.1專業(yè)搜索引擎的優(yōu)勢39
3.7.2著名的專業(yè)搜索引擎39
擴展閱讀:百度搜索技巧41
第4章 文獻檢索概述42
4.1文獻檢索的意義42
4.1.1文獻的定義42
4.1.2信息檢索的含義42
4.1.3文獻檢索的意義42
4.2文獻檢索的基礎知識42
4.2.1邏輯運算符42
4.2.2通配符43
4.2.3位置算符43
4.2.4主要檢索字段44
4.2.5文獻資源分類45
4.2.6主要文獻類型45
4.3文獻檢索基本流程46
4.4文獻檢索途徑及案例47
4.4.1研究類文獻檢索47
4.4.2數(shù)據(jù)事實檢索50
第5章 中文學術論文資源數(shù)據(jù)庫65
5.1中國知網(wǎng)65
5.1.1中國知網(wǎng)概況65
5.1.2中國學術期刊(網(wǎng)絡版)65
5.1.3中國學術輯刊全文數(shù)據(jù)庫65
5.1.4中國博士學位論文全文數(shù)據(jù)庫67
5.1.5中國優(yōu)秀碩士學位論文全文數(shù)據(jù)庫71
5.1.6中國重要會議論文全文數(shù)據(jù)庫71
5.1.7CNKI國家科技成果數(shù)據(jù)庫72
5.2萬方數(shù)據(jù)知識服務平臺73
5.2.1萬方數(shù)據(jù)知識服務平臺概況73
5.2.2中國學術期刊數(shù)據(jù)庫74
5.2.3中國學位論文全文數(shù)據(jù)庫74
5.2.4中國學術會議文獻數(shù)據(jù)庫75
5.2.5中文科技報告數(shù)據(jù)庫76
5.3維普網(wǎng)77
5.3.1維普期刊資源整合服務平臺概況77
5.3.2中文科技期刊數(shù)據(jù)庫77
5.3.3中國科學指標數(shù)據(jù)庫79
第6章 外文學術論文資源數(shù)據(jù)庫81
6.1Web of Science81
6.1.1Web of Science概況81
6.1.2Web of Science Core Collection83
6.1.3Derwent Innovations Index91
6.1.4INSPEC93
6.1.5Chinese Science Citation Database93
6.1.6Journal Citation Reports94
6.2美國《化學文摘》94
6.2.1美國化學文摘概況94
6.2.2美國《化學文摘》(網(wǎng)絡版)95
6.2.3SciFinder檢索方式及檢索結(jié)果95
6.3《工程索引》104
6.3.1Engineering Village概況104
6.3.2Ei Compendex檢索方式及檢索結(jié)果105
6.4ScienceDirect109
6.4.1ScienceDirect數(shù)據(jù)庫簡介109
6.4.2ScienceDirect檢索方式及結(jié)果109
6.5Wiley Online Library113
6.5.1Wiley Online Library 數(shù)據(jù)庫簡介113
6.5.2Wiley Online Library檢索方式及檢索結(jié)果114
6.6SpringerLink118
6.6.1SpringerLink數(shù)據(jù)庫簡介118
6.6.2SpringerLink檢索方式及檢索結(jié)果118
6.7其他外文文獻數(shù)據(jù)庫120
6.7.1Online Computer Library Center120
6.7.2ProQuest 平臺121
第7章 專利文獻與技術標準123
7.1專利文獻123
7.1.1專利概述123
7.1.2美國專利文獻概述125
7.1.3中國專利文獻概述128
7.1.4中國專利全文數(shù)據(jù)庫129
7.1.5萬方中外專利數(shù)據(jù)庫129
7.1.6SIPO中國及多國專利查詢系統(tǒng)130
7.2技術標準132
7.2.1技術標準概述132
7.2.2國際標準化組織(ISO)簡介132
7.2.3ISO9000族標準及ISO14000族標準簡介132
7.2.4中國標準的分類133
7.2.5國家標準全文數(shù)據(jù)庫134
7.2.6中國行業(yè)標準全文數(shù)據(jù)庫134
7.2.7中外標準數(shù)據(jù)庫135
第8章 化學信息數(shù)據(jù)庫資源136
8.1數(shù)據(jù)庫簡介136
8.1.1數(shù)據(jù)136
8.1.2數(shù)據(jù)庫136
8.1.3數(shù)據(jù)庫管理系統(tǒng)136
8.1.4數(shù)據(jù)庫系統(tǒng)(database system)137
8.2數(shù)據(jù)庫歷史及分類137
8.2.1數(shù)據(jù)庫歷史137
8.2.2數(shù)據(jù)庫的模型分類139
8.3三類化學信息數(shù)據(jù)庫139
8.3.1文獻數(shù)據(jù)庫139
8.3.2事實數(shù)據(jù)庫140
8.3.3結(jié)構數(shù)據(jù)庫140
8.4Internet上的化學化工數(shù)據(jù)庫140
8.4.1Spectral Database for Organic Compounds140
8.4.2NIST Chemistry WebBook141
8.4.3NIST Atomic Spectra Database142
8.4.4Reaxys數(shù)據(jù)庫143
8.4.5劍橋晶體數(shù)據(jù)庫144
第9章 化學軟件147
9.1概述147
9.2化學軟件的分類148
9.3語言軟件和依托算法的化學計算軟件149
9.3.1MATLAB149
9.3.2R語言161
9.4繪圖軟件170
9.4.1ChemBioOffice170
9.4.2ACD/ChemSketch5.0171
9.4.3Symyx Draw173
9.5化學分析儀器數(shù)據(jù)處理軟件174
9.5.1GRAMS174
9.5.2MestReNova177
9.5.3Origin178
9.6分子模擬軟件179
9.6.1分子對接軟件AutoDock179
9.6.2量子化學計算軟件——Gaussian程序180
9.6.3分子動力學模擬軟件182
第10章 信息處理與數(shù)據(jù)挖掘185
10.1概述185
10.2數(shù)據(jù)的標準化186
10.3特征提取與優(yōu)化186
10.3.1主成分分析186
10.3.2偏最小二乘法189
10.3.3逐步回歸分析189
10.3.4遺傳算法191
10.4信號處理方法192
10.4.1協(xié)方差與相關系數(shù)193
10.4.2自、互相關分析193
10.4.3功率譜密度194
10.4.4傅里葉變換194
10.4.5小波變換195
10.5機器學習方法198
10.5.1K最近鄰法198
10.5.2概率神經(jīng)網(wǎng)絡198
10.5.3分類回歸樹199
10.5.4助推法200
10.5.5人工神經(jīng)網(wǎng)絡201
10.5.6支持向量機204
10.6數(shù)據(jù)庫挖掘技術206
10.6.1聚類算法206
10.6.2決策樹算法207
10.7Web數(shù)據(jù)挖掘技術207
10.7.1Web內(nèi)容挖掘207
10.7.2Web結(jié)構挖掘207
10.7.3Web日志挖掘208
擴展閱讀:化學計量學208
第11章 QSAR及藥物設計209
11.1概述209
11.2QSAR模型的分類210
11.2.1二維定量構效關系(2D-QSAR)210
11.2.2三維定量構效關系(3D-QSAR)212
11.2.3多維定量構效關系214
11.2.4方法評價215
11.3定量構效關系研究中常用的回歸分析法216
11.3.1多元線性回歸216
11.3.2主成分回歸217
11.3.3偏最小二乘回歸217
11.3.4投影尋蹤回歸218
11.3.5非線性方法219
11.4藥物設計219
11.4.1類藥性220
11.4.2脂水分布系數(shù)lgP220
11.4.3腦血分配系數(shù)220
11.4.4腸穿透性221
11.4.5水溶性221
11.4.6毒性221
11.5精準醫(yī)療221
11.6高通量篩選222
11.7QSAR方法的應用示例222
擴展閱讀:定量構效關系226
第12章 生物信息學227
12.1什么是生物信息學227
12.2生物信息學的發(fā)展歷程228
12.3生物信息學的研究內(nèi)容230
12.3.1生物信息挖掘230
12.3.2藥物設計231
12.3.3基因組學231
12.3.4蛋白質(zhì)組學232
12.3.5代謝組學234
12.4生物信息學的研究方法235
12.4.1數(shù)學統(tǒng)計方法235
12.4.2動態(tài)規(guī)劃方法235
12.4.3模式識別技術235
12.4.4數(shù)據(jù)庫技術235
12.4.5分子模型化技術235
12.4.6分子力學和量子力學計算236
12.4.7分子動力學模擬236
12.5生物信息學的應用236
12.6生物信息學的研究趨勢及未來挑戰(zhàn)237
12.7蛋白質(zhì)功能研究238
12.8蛋白質(zhì)數(shù)據(jù)庫簡介239
12.8.1綜合性蛋白質(zhì)數(shù)據(jù)庫240
12.8.2專用性蛋白質(zhì)數(shù)據(jù)庫241
12.9蛋白質(zhì)序列的特征提取方法242
12.9.1基于氨基酸組成和位置的特征提取方法243
12.9.2基于氨基酸物理化學特性的特征提取方法244
12.9.3基于數(shù)據(jù)庫信息挖掘的特征提取方法245
12.10蛋白質(zhì)相互作用247
12.11蛋白質(zhì)網(wǎng)絡252
12.11.1蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡252
12.11.2氨基酸殘基網(wǎng)絡254
擴展閱讀:高通量基因表達檢測技術255
參考文獻256