基于文本挖掘的藥品不良反應(yīng)知識發(fā)現(xiàn)
定 價:66 元
- 作者:劉婧,趙嵩正
- 出版時間:2023/6/15
- ISBN:9787513081917
- 出 版 社:知識產(chǎn)權(quán)出版社
- 中圖法分類:R961-39
- 頁碼:188
- 紙張:
- 版次:1
- 開本:16開
本書凝練了作者近七年來的研究成果,融合了國家自然科學(xué)基金項目和博士后科學(xué)基金面上項目(一等)的相關(guān)研究成果。 基于設(shè)計科學(xué)、文本挖掘、信息抽取和機器學(xué)習(xí)等理論和方法,搭建了數(shù)據(jù)驅(qū)動的社交媒體中藥品不良反應(yīng)知識發(fā)現(xiàn)框架。在應(yīng)用層面,從非結(jié)構(gòu)化的文本數(shù)據(jù)中最終提取出潛在的(藥品-不良反應(yīng))知識,首先從社會媒體平臺上海量數(shù)據(jù)中過濾掉了不包含不良反應(yīng)信息的不相關(guān)文本,然后從非結(jié)構(gòu)化文本中提取了疾病癥狀等實體,最后區(qū)分了藥品和提取的疾病癥狀等實體間的關(guān)系類型(如藥品不良反應(yīng)還是藥品適應(yīng)癥)。在方法層面,針對數(shù)據(jù)非均衡、高維、不規(guī)范、標注難且成本高的特點,從特征和算法兩個角度,提出了一系列改進的文本分類、實體識別和關(guān)系抽取方法。
本書在Web 2.0和Health 2.0的背景下,基于設(shè)計科學(xué)、文本挖掘、信息抽取和機器學(xué)習(xí)等理論與方法,搭建了社會媒體中藥品不良反應(yīng)知識發(fā)現(xiàn)框架;實現(xiàn)了特征向量的提取和多種核方法,并基于集成學(xué)習(xí)和半監(jiān)督學(xué)習(xí),構(gòu)建了一系列藥品不良反應(yīng)關(guān)系抽取模型,識別了藥品實體和癥狀/疾病實體間的關(guān)系類別,減少了社會媒體上數(shù)據(jù)高維特征的影響及模型對標注數(shù)據(jù)的依賴,提升了藥品不良反應(yīng)關(guān)系抽取模型的性能。通過本書的研究,在理論上豐富和補充了文本挖掘、集成學(xué)習(xí)和半監(jiān)督學(xué)習(xí)的理論研究體系;在實踐上,有助于完善藥品的安全性信息,為相關(guān)部門提供決策支持,實現(xiàn)了數(shù)據(jù)驅(qū)動的藥物警戒,是面向人民生命健康進行科技創(chuàng)新的重要實踐。
劉婧,天津財經(jīng)大學(xué)管理信息系統(tǒng)系教師,西北工業(yè)大學(xué)博士,長期從事數(shù)據(jù)驅(qū)動的決策支持研究,研究方向為文本挖掘和智慧醫(yī)療。主持國家自然科學(xué)基金青年項目1項,主持中國博士后科學(xué)基金面上項目(一等)1項,參與國家級及省部級研究項目3項;發(fā)表高水平學(xué)術(shù)論文10余篇,參與編寫教材2部;入選天津市高!扒嗄旰髠淙瞬胖С钟媱潯,入選天津市“131”創(chuàng)新型人才培養(yǎng)工程第三層次。
目 錄
第1章 緒論001
1.1 研究背景與意義 / 001
1.2 國內(nèi)外研究現(xiàn)狀 / 003
1.2.1 社會媒體環(huán)境下藥品不良反應(yīng)知識發(fā)現(xiàn)研究 / 003
1.2.2 文本挖掘相關(guān)研究 / 007
1.2.3 研究述評 / 017
1.3 研究內(nèi)容與創(chuàng)新點 / 018
1.3.1 研究內(nèi)容 / 018
1.3.2 創(chuàng)新性 / 021
1.4 研究方法 / 022
第2章 藥品不良反應(yīng)相關(guān)文本識別023
2.1 基于層次注意力的多文檔表征融合模型 / 023
2.1.1 基于深度學(xué)習(xí)的深層文本表征 / 025
2.1.2 考慮外部領(lǐng)域知識的特征工程 / 028
2.1.3 層次注意力機制 / 030
2.1.4 實驗設(shè)置 / 032
2.1.5 實驗結(jié)果與分析 / 033
2.2 基于多視圖主動學(xué)習(xí)的藥品不良反應(yīng)相關(guān)文本識別模型 / 036
2.2.1 基于多視圖主動學(xué)習(xí)的藥品不良反應(yīng)相關(guān)文本識別框架 / 037
2.2.2 基于多文檔表征的多視圖生成機制 / 039
2.2.3 樣本選擇策略 / 041
2.2.4 MVAL4D的偽代碼 / 044
2.2.5 實驗設(shè)置 / 046
2.2.6 實驗結(jié)果與分析 / 048
2.3 小結(jié) / 052
第3章 藥品不良反應(yīng)命名實體識別054
3.1 基于傳統(tǒng)CRF的藥品不良反應(yīng)實體識別模型構(gòu)建 / 054
3.1.1 條件隨機場 / 054
3.1.2 特征提取 / 055
3.2 基于Bi-LSTM-CRF的藥品不良反應(yīng)實體識別模型構(gòu)建 / 056
3.3 實驗設(shè)置 / 058
3.3.1 數(shù)據(jù)集 / 058
3.3.2 實驗過程 / 059
3.3.3 評價指標 / 059
3.4 實驗結(jié)果與分析 / 059
3.5 小結(jié) / 062
第4章 基于組合學(xué)習(xí)的藥品不良反應(yīng)關(guān)系抽取063
4.1 基于特征的藥品不良反應(yīng)關(guān)系抽取 / 063
4.1.1 特征提取 / 063
4.1.2 特征選擇 / 069
4.1.3 實驗設(shè)置 / 071
4.1.4 實驗結(jié)果與分析 / 074
4.2 基于核方法的藥品不良反應(yīng)關(guān)系抽取 / 078
4.2.1 典型核 / 079
4.2.2 實驗設(shè)置 / 086
4.2.3 實驗結(jié)果與分析 / 086
4.3 基于組合學(xué)習(xí)的藥品不良反應(yīng)關(guān)系抽取集成框架 / 088
4.3.1 基分類器融合方法 / 088
4.3.2 實驗設(shè)置 / 092
4.3.3 實驗結(jié)果與分析 / 093
4.4 基于詞匯語義相似度和詞性分析的POS-SSDP核方法 / 096
4.4.1 對基于核的關(guān)系抽取方法進行改進的必要性 / 096
4.4.2 詞匯語義相似度 / 099
4.4.3 POS-SSDP:嵌入詞匯語義信息和詞性分析的最短依賴路徑核 / 103
4.4.4 實驗設(shè)置 / 104
4.4.5 實驗結(jié)果與分析 / 106
4.5 小結(jié) / 111
第5章 基于半監(jiān)督學(xué)習(xí)和集成學(xué)習(xí)的藥品不良反應(yīng)關(guān)系抽取112
5.1 基于半監(jiān)督集成學(xué)習(xí)的藥品不良反應(yīng)關(guān)系抽取 / 112
5.1.1 半監(jiān)督學(xué)習(xí) / 112
5.1.2 集成學(xué)習(xí) / 115
5.1.3 Co-Ensemble方法 / 118
5.1.4 實驗設(shè)置 / 121
5.1.5 實驗結(jié)果與分析 / 123
5.2 基于改進隨機子空間的藥品不良反應(yīng)關(guān)系抽取 / 131
5.2.1 隨機子空間相關(guān)工作 / 131
5.2.2 基于分層采樣的隨機子空間方法 / 132
5.2.3 使用的特征 / 135
5.2.4 實驗設(shè)置 / 136
5.2.5 實驗結(jié)果與分析 / 137
5.3 基于改進半監(jiān)督學(xué)習(xí)的藥品不良反應(yīng)關(guān)系抽取 / 143
5.3.1 使用Lasso改進基于分歧的半監(jiān)督學(xué)習(xí) / 144
5.3.2 實驗結(jié)果與分析 / 147
5.4 小結(jié) / 150
參考文獻152