本書系統(tǒng)性闡述了醫(yī)學大數(shù)據(jù)的內(nèi)涵、特點、分類及特征工程,針對性概述了人工智能相關(guān)基本理論知識,系統(tǒng)介紹了人工智能在醫(yī)學大數(shù)據(jù)中的典型應(yīng)用的方向,以及醫(yī)學大數(shù)據(jù)和人工智能結(jié)合帶來的產(chǎn)業(yè)價值,前瞻性總結(jié)了醫(yī)學大數(shù)據(jù)和人工智能的發(fā)展趨勢和未來挑戰(zhàn)。本書邏輯清晰、知識體系完整、重點突出、通俗易懂,適合作為普通高等院校醫(yī)學信息學、智能醫(yī)學、生物醫(yī)學工程等專業(yè)的基礎(chǔ)教材,也可作為有志于智能醫(yī)學領(lǐng)域研究的教學、科研、管理以及產(chǎn)業(yè)人員的參考書。
2020 年5 月,人民衛(wèi)生出版社和中華醫(yī)學會醫(yī)學信息學分會共同召開了全國高等學校衛(wèi)生信息管理/ 醫(yī)學信息學專業(yè)第三輪規(guī)劃教材修訂論證會,擬定了第三輪規(guī)劃教材的品種,并針對學科前沿發(fā)展的需求新增了《醫(yī)學大數(shù)據(jù)與人工智能》這本教材。2021 年6 月在南京醫(yī)科大學召開了《醫(yī)學大數(shù)據(jù)與人工智能》教材的編寫會,正式開啟了本教材的編撰工作。
隨著信息化技術(shù)的普及,醫(yī)學大數(shù)據(jù)呈現(xiàn)爆發(fā)式增長,給傳統(tǒng)醫(yī)學和傳統(tǒng)醫(yī)院管理模式帶來挑戰(zhàn)。人工智能的飛速發(fā)展,大大地加快了醫(yī)學大數(shù)據(jù)的價值輸出,我們從數(shù)據(jù)獲取時代,逐步向信息挖掘時代和價值輸出時代過渡。醫(yī)學大數(shù)據(jù)的價值,也從醫(yī)療行為的總結(jié),逐步升級為醫(yī)療決策的支持。
本教材系統(tǒng)性地闡述了醫(yī)學大數(shù)據(jù)的內(nèi)涵、特點、分類及特征工程,針對性地概述了人工智能相關(guān)基本理論,系統(tǒng)地介紹了人工智能在醫(yī)學大數(shù)據(jù)中的典型應(yīng)用的方向,以及醫(yī)學大數(shù)據(jù)和人工智能結(jié)合帶來的產(chǎn)業(yè)價值,前瞻性地總結(jié)了醫(yī)學大數(shù)據(jù)和人工智能的發(fā)展趨勢和未來挑戰(zhàn)。本教材適合作為普通高等院校醫(yī)學信息學、智能醫(yī)學、生物醫(yī)學工程等專業(yè)的基礎(chǔ)教材,也可作為有志于智能醫(yī)學領(lǐng)域研究的教學、科研、管理以及產(chǎn)業(yè)人員的參考書。本教材的內(nèi)容大致分為四大部分,分別討論醫(yī)學大數(shù)據(jù)、醫(yī)學數(shù)據(jù)治理與分析、醫(yī)學人工智能、醫(yī)學大數(shù)據(jù)與人工智能的應(yīng)用和趨勢。
第一部分是醫(yī)學大數(shù)據(jù),系統(tǒng)地闡述了醫(yī)學大數(shù)據(jù)的要素、特點和分類,內(nèi)容包括醫(yī)學大數(shù)據(jù)與人工智能概述、醫(yī)學大數(shù)據(jù)的關(guān)鍵要素、電子病歷數(shù)據(jù)、醫(yī)學影像數(shù)據(jù)、生理信號數(shù)據(jù)、生命組學數(shù)據(jù),讓讀者對醫(yī)學大數(shù)據(jù)有一個系統(tǒng)和科學的宏觀認識。
第二部分是醫(yī)學數(shù)據(jù)治理與分析,系統(tǒng)地闡述了數(shù)據(jù)治理、數(shù)據(jù)分析與挖掘的基礎(chǔ)知識和算法,內(nèi)容包括醫(yī)學大數(shù)據(jù)治理、醫(yī)學大數(shù)據(jù)挖掘、醫(yī)學大數(shù)據(jù)融合分析,讓讀者對醫(yī)學大數(shù)據(jù)的分析方法和流程有一個清晰的概念和基本了解。
第三部分是醫(yī)學人工智能,系統(tǒng)地闡述了人工智能的基礎(chǔ)理論知識和醫(yī)學領(lǐng)域應(yīng)用的基本算法,內(nèi)容包括醫(yī)學人工智能基礎(chǔ)、醫(yī)學自然語言處理、醫(yī)學影像的人工智能分析、生理信號數(shù)據(jù)的人工智能分析,讓讀者對醫(yī)學人工智能的算法有一個清晰的概念和基本了解。
第四部分是醫(yī)學大數(shù)據(jù)與人工智能的應(yīng)用和趨勢,主要介紹人工智能在醫(yī)學大數(shù)據(jù)中的應(yīng)用案例和發(fā)展趨勢,內(nèi)容包括大數(shù)據(jù)與人工智能在醫(yī)學領(lǐng)域的應(yīng)用、醫(yī)學大數(shù)據(jù)與人工智能的發(fā)展趨勢及挑戰(zhàn),激發(fā)讀者對新知識、新技術(shù)的好奇心,為有志從事這一行業(yè)的讀者提供指引。
本教材不僅是一本紙質(zhì)書籍,還是一個網(wǎng)上數(shù)字資源庫。數(shù)字資源編寫思路與教材的編寫思路保持一致,為每一章提供了教學課件和補充材料。通過線上數(shù)字資源建設(shè)和維護,使之能夠成為一本帶有鮮明數(shù)據(jù)實踐特征的立體教學資源。
參與編寫本教材的編者都是從事相關(guān)行業(yè)多年的業(yè)界專家,有著豐富的從業(yè)經(jīng)驗,在此對他們的出色工作表示感謝。特別感謝南京醫(yī)科大學劉賓、復(fù)旦大學王昌然等人為本書的完成所提供的協(xié)助與辛勤付出,謹在此對他們表示由衷的感謝。技術(shù)潮流的變化日新月異,本書在編寫內(nèi)容上難免有所紕漏,希望讀者們不吝賜教,幫助我們共同提高進步,并為下一版教材的修訂提供寶貴的意見與建議。
李建清 劉 雷
2023 年5 月
南京醫(yī)科大學教授、博士生導(dǎo)師,副校長,臨床醫(yī)學工程重點實驗室主任,江蘇省遠程測控技術(shù)重點實驗室副主任,江蘇省重點(培育)學科生物醫(yī)學工程學科帶頭人,江蘇省333工程中青年學術(shù)帶頭人。長期從事無線傳感器網(wǎng)絡(luò),可穿戴醫(yī)療器械、醫(yī)療大數(shù)據(jù)尤其是心電數(shù)據(jù)、康復(fù)機器人技術(shù)、機器人臨場感技術(shù)等研究。近年來,先后承擔了國家重點研發(fā)計劃、國家自然基金面上和主任項目、國家863項目、江蘇省自然科學基金項目
第一章 醫(yī)學大數(shù)據(jù)與人工智能概述/ 1
第一節(jié) 醫(yī)學大數(shù)據(jù)與人工智能的發(fā)展歷程 / 1
一、 信息技術(shù)的發(fā)展 / 1
二、 醫(yī)療信息化的發(fā)展 / 2
三、 生物信息學的發(fā)展 / 3
四、 醫(yī)學大數(shù)據(jù)的出現(xiàn) / 4
五、 醫(yī)學人工智能的出現(xiàn) / 5
第二節(jié) 醫(yī)學大數(shù)據(jù)的內(nèi)涵和特點 / 6
一、 醫(yī)學大數(shù)據(jù)基本概念 / 6
二、 真實世界大數(shù)據(jù)的特點及概念 / 7
三、 醫(yī)學大數(shù)據(jù)特點 / 7
四、 多模態(tài)醫(yī)學大數(shù)據(jù) / 9
第三節(jié) 醫(yī)學大數(shù)據(jù)的分類 / 9
一、 電子病歷數(shù)據(jù) / 9
二、 醫(yī)學影像數(shù)據(jù) / 11
三、 生理信號數(shù)據(jù) / 11
四、 生命組學數(shù)據(jù) / 12
第四節(jié) 醫(yī)學大數(shù)據(jù)處理主要環(huán)節(jié) / 12
一、 數(shù)據(jù)采集 / 13
二、 數(shù)據(jù)治理 / 13
三、 數(shù)據(jù)應(yīng)用 / 14
第五節(jié) 醫(yī)學大數(shù)據(jù)的價值 / 15
一、 醫(yī)學大數(shù)據(jù)的價值體現(xiàn) / 15
二、 醫(yī)學大數(shù)據(jù)的價值實現(xiàn) / 15
三、 醫(yī)學大數(shù)據(jù)的價值陷阱 / 17
四、 醫(yī)學大數(shù)據(jù)的未來 / 17
第二章 醫(yī)學大數(shù)據(jù)的關(guān)鍵要素/ 19
第一節(jié) 數(shù)據(jù)質(zhì)量 / 19
一、 數(shù)據(jù)準確性 / 19
二、 數(shù)據(jù)一致性 / 19
三、 數(shù)據(jù)合規(guī)性 / 20
四、 數(shù)據(jù)完整性 / 20
五、 數(shù)據(jù)及時性 / 20
第二節(jié) 數(shù)據(jù)標注 / 20
一、 數(shù)據(jù)標注定義及類型 / 21
二、 數(shù)據(jù)標注方法 / 21
三、 數(shù)據(jù)標注工具 / 23
四、 常見的數(shù)據(jù)標注結(jié)果文件格式 / 24
第三節(jié) 數(shù)據(jù)標準化 / 25
一、 醫(yī)學大數(shù)據(jù)標準化重要性 / 25
二、 醫(yī)學大數(shù)據(jù)標準化體系 / 26
三、 醫(yī)學大數(shù)據(jù)標準化方法 / 26
第四節(jié) 數(shù)據(jù)安全 / 28
一、 醫(yī)學大數(shù)據(jù)安全概念 / 28
二、 醫(yī)學大數(shù)據(jù)隱私保護 / 28
三、 醫(yī)學大數(shù)據(jù)安全管理 / 29
第五節(jié) 數(shù)據(jù)可視化 / 30
一、 數(shù)據(jù)可視化基礎(chǔ) / 30
二、 復(fù)雜高維多元數(shù)據(jù)的可視化 / 31
三、 基于網(wǎng)頁的數(shù)據(jù)可視化 / 32
第三章 電子病歷數(shù)據(jù)/ 35
第一節(jié) 電子病歷數(shù)據(jù)來源 / 35
一、 醫(yī)院管理信息系統(tǒng) / 35
二、 電子病歷系統(tǒng) / 36
三、 檢驗信息系統(tǒng) / 36
四、 手術(shù)麻醉管理系統(tǒng) / 37
五、 臨床專科信息系統(tǒng) / 38
第二節(jié) 電子病歷數(shù)據(jù)標準 / 39
一、 醫(yī)學數(shù)據(jù)語義標準 / 39
二、 醫(yī)學信息模型標準 / 41
第三節(jié) 電子病歷數(shù)據(jù)集成 / 46
一、 基于標準的集成 / 48
二、 基于數(shù)據(jù)庫的集成 / 48
三、 基于中間件的集成 / 49
第四節(jié) 電子病歷數(shù)據(jù)質(zhì)量 / 53
一、 電子病歷數(shù)據(jù)質(zhì)量評估 / 53
二、 電子病歷數(shù)據(jù)清洗和處理 / 56
第四章 醫(yī)學影像數(shù)據(jù)/ 60
第一節(jié) 醫(yī)學影像數(shù)據(jù)采集 / 60
一、 直接DICOM 采集 / 60
二、 間接DICOM 采集 / 61
三、 視頻采集 / 62
四、 膠片采集 / 62
五、 病理圖像采集 / 63
第二節(jié) 醫(yī)學影像數(shù)據(jù)類型 / 63
一、 放射影像 / 63
二、 核醫(yī)學影像 / 65
三、 超聲影像 / 66
四、 其他影像 / 66
第三節(jié) 醫(yī)學影像數(shù)據(jù)標準 / 68
一、 DICOM 標準的發(fā)展 / 68
二、 DICOM 標準內(nèi)容概述 / 69
三、 DICOM 醫(yī)學應(yīng)用 / 71
第四節(jié) 醫(yī)學影像數(shù)據(jù)要素分析 / 73
一、 影像數(shù)據(jù)同質(zhì)化需求 / 73
二、 醫(yī)學影像全流程質(zhì)控 / 73
三、 影像數(shù)據(jù)的規(guī)范化標注 / 76
第五章 生理信號數(shù)據(jù)/ 81
第一節(jié) 生理信號數(shù)據(jù)來源 / 81
一、 循環(huán)系統(tǒng)生理信號獲取 / 81
二、 呼吸系統(tǒng)生理信號獲取 / 86
三、 神經(jīng)系統(tǒng)生理信號獲取 / 88
四、 運動系統(tǒng)生理信號獲取 / 90
第二節(jié) 生理信號數(shù)據(jù)類型 / 93
一、 心電信號數(shù)據(jù) / 93
二、 腦電信號數(shù)據(jù) / 94
三、 肌電信號數(shù)據(jù) / 96
四、 多導(dǎo)生理信號數(shù)據(jù) / 97
第三節(jié) 生理信號數(shù)據(jù)要素分析 / 99
一、 數(shù)據(jù)標準 / 99
二、 數(shù)據(jù)隱私 / 101
三、 數(shù)據(jù)標注 / 102
第六章 生命組學數(shù)據(jù)/ 104
第一節(jié) 生命組學數(shù)據(jù)的來源 / 104
一、 芯片來源 / 104
二、 測序來源 / 106
三、 質(zhì)譜來源 / 108
四、 磁共振來源 / 109
第二節(jié) 生命組學數(shù)據(jù)的類型 / 109
一、 基因組數(shù)據(jù) / 110
二、 轉(zhuǎn)錄組數(shù)據(jù) /111
三、 表觀組數(shù)據(jù) / 113
四、 蛋白質(zhì)組數(shù)據(jù) / 115
五、 代謝組數(shù)據(jù) / 116
六、 微生物組數(shù)據(jù) / 117
第三節(jié) 生命組學數(shù)據(jù)的要素分析 / 119
一、 生命組學數(shù)據(jù)工具 / 119
二、 生命組學數(shù)據(jù)資源 / 122
三、 生命組學數(shù)據(jù)分析 / 127
第七章 醫(yī)學大數(shù)據(jù)治理/ 134
第一節(jié) 數(shù)據(jù)治理概述 / 134
一、 概述 / 134
二、 真實世界臨床數(shù)據(jù)現(xiàn)狀 / 135
三、 數(shù)據(jù)治理的必要性 / 136
第二節(jié) 數(shù)據(jù)預(yù)處理 / 137
一、 數(shù)據(jù)提取 / 137
二、 數(shù)據(jù)清洗 / 138
三、 數(shù)據(jù)轉(zhuǎn)換 / 140
四、 數(shù)據(jù)歸約 / 141
第三節(jié) 缺失值與離群值處理 / 142
一、 缺失數(shù)據(jù)類型 / 142
二、 缺失數(shù)據(jù)處理 / 143
三、 離群值產(chǎn)生 / 145
四、 離群值處理 / 147
第四節(jié) 數(shù)據(jù)質(zhì)量控制 / 148
一、 數(shù)據(jù)質(zhì)量管理計劃 / 149
二、 真實世界數(shù)據(jù)適用性 / 150
三、 數(shù)據(jù)質(zhì)量過程控制 / 150
第八章 醫(yī)學大數(shù)據(jù)挖掘/ 153
第一節(jié) 數(shù)據(jù)挖掘的實施步驟 / 153
一、 數(shù)據(jù)挖掘在醫(yī)學中的應(yīng)用 / 153
二、 問題提出與分析思路 / 154
三、 研究類型與研究設(shè)計 / 155
第二節(jié) 特征選擇與數(shù)據(jù)降維 / 156
一、 基于變量選擇的數(shù)據(jù)降維理論 / 157
二、 多元線性回歸 / 157
三、 最優(yōu)子集 / 159
四、 壓縮估計 / 160
五、 超高維數(shù)據(jù)降維 / 161
第三節(jié) 常用的機器學習算法 / 162
一、 機器學習算法的分類 / 162
二、 有監(jiān)督學習 / 164
三、 無監(jiān)督學習 / 168
第四節(jié) 數(shù)據(jù)挖掘方法評價與驗證 / 170
一、 方法性能評價 / 170
二、 方法驗證 / 173
三、 方法學以外的影響因素 / 174
第五節(jié) 醫(yī)學大數(shù)據(jù)挖掘方法應(yīng)用 / 174
一、 問題提出 / 175
二、 方法應(yīng)用 / 175
三、 結(jié)果解讀 / 177
第九章 醫(yī)學大數(shù)據(jù)融合分析/ 182
第一節(jié) 多模態(tài)數(shù)據(jù)的定義 / 182
一、 數(shù)據(jù)的模態(tài) / 182
二、 臨床研究中多模態(tài)數(shù)據(jù)的來源 / 182
三、 多模態(tài)數(shù)據(jù)示例 / 183
第二節(jié) 多模態(tài)數(shù)據(jù)融合方法 / 184
一、 基于階段的融合方法 / 185
二、 基于特征的融合方法 / 186
三、 基于語義的融合方法 / 187
第三節(jié) 多模態(tài)數(shù)據(jù)缺失值處理方法 / 191
一、 基于監(jiān)督學習的缺失值處理方法 / 191
二、 基于無監(jiān)督學習的補全方法 / 193
三、 融合醫(yī)學多模態(tài)數(shù)據(jù)知識的缺失值填充辦法 / 196
第四節(jié) 多模態(tài)數(shù)據(jù)的模態(tài)不均衡性處理方法 / 197
一、 基于稀疏編碼的自主學習模型 / 197
二、 遷移主成分分析 / 199
三、 基于語義特征的遷移融合 / 199
四、 深度神經(jīng)網(wǎng)絡(luò)在模態(tài)不均衡處理中的應(yīng)用 / 200
第十章 醫(yī)學人工智能基礎(chǔ)/ 202
第一節(jié) 醫(yī)學人工智能概論 / 202
一、 人工智能簡介 / 202
二、 典型醫(yī)學人工智能應(yīng)用場景 / 203
三、 醫(yī)學人工智能面臨的挑戰(zhàn) / 204
第二節(jié) 人工智能基礎(chǔ)算法 / 204
一、 人工智能算法概述 / 205
二、 人工智能算法基礎(chǔ) / 207
第三節(jié) 人工智能算法進階 / 215
一、 遷移學習 / 215
二、 對抗生成 / 218
三、 強化學習 / 219
第十一章 醫(yī)學自然語言處理/ 224
第一節(jié) 醫(yī)學自然語言處理基礎(chǔ) / 224
一、 自然語言處理常見任務(wù)與典型模型 / 224
二、 醫(yī)學文本處理任務(wù)與難點 / 231
三、 醫(yī)學文本數(shù)據(jù)資源建設(shè) / 239
第二節(jié) 電子病歷文本處理任務(wù)與模型 / 241
一、 電子病歷搜索 / 241
二、 電子病歷結(jié)構(gòu)化 / 244
三、 語言模型與電子病歷文本處理 / 247
第三節(jié) 診療對話系統(tǒng) / 249
一、 對話系統(tǒng)分類 / 249
二、 任務(wù)型對話系統(tǒng) / 250
三、 診療對話系統(tǒng)核心技術(shù) / 251
四、 診療對話系統(tǒng)例子 / 254
第十二章 醫(yī)學影像的人工智能分析/ 257
第一節(jié) 醫(yī)學影像智能分析基礎(chǔ) / 257
一、 影像重建中的人工智能技術(shù) / 257
二、 影像分割與檢測中的人工智能技術(shù) / 259
三、 影像診斷中的人工智能技術(shù) / 260
第二節(jié) 基于人工智能的腦影像自動分析 / 261
一、 腦影像高質(zhì)量重建 / 261
二、 腦影像分割 / 262
三、 腦疾病診斷 / 265
第三節(jié) 基于人工智能的心血管影像自動分析 / 268
一、 心臟影像高質(zhì)量重建 / 268
二、 心臟結(jié)構(gòu)分割 / 269
三、 心血管疾病診斷 / 272
第四節(jié) 基于人工智能的肺部影像自動分析 / 273
一、 肺結(jié)節(jié)檢測 / 273
二、 肺部疾病的診斷 / 274
第十三章 生理信號數(shù)據(jù)的人工智能分析/ 277
第一節(jié) 生理信號數(shù)據(jù)人工智能處理概述 / 277
第二節(jié) 心電信號處理中的人工智能技術(shù) / 278
一、 信號質(zhì)量評估 / 278
二、 特征提取 / 282
三、 異常分類 / 287
第三節(jié) 腦電信號處理中的人工智能技術(shù) / 291
一、 信號預(yù)處理 / 291
二、 特征提取 / 293
三、 抑郁檢測 / 294
第四節(jié) 肌電信號處理中的人工智能技術(shù) / 295
一、 信號質(zhì)量評估 / 296
二、 特征提取 / 297
三、 動作識別 / 298
第五節(jié) 基于多生理信號分析的人工智能應(yīng)用 / 300
一、 多參記錄儀信號分析 / 300
二、 多導(dǎo)睡眠圖信號分析 / 304
三、 情感計算中多生理信號分析 / 308
四、 重癥監(jiān)護多生理信號分析 / 311
第十四章 大數(shù)據(jù)與人工智能在醫(yī)學領(lǐng)域的應(yīng)用/ 316
第一節(jié) 智能臨床決策系統(tǒng) / 316
一、 臨床診療的決策過程 / 316
二、 臨床決策系統(tǒng)的發(fā)展 / 318
三、 臨床決策系統(tǒng)的應(yīng)用 / 320
第二節(jié) 公共衛(wèi)生監(jiān)測 / 320
一、 大數(shù)據(jù)與公共衛(wèi)生 / 321
二、 傳染病監(jiān)測與管理 / 322
三、 慢性病監(jiān)測與管理 / 324
四、 健康管理 / 326
第三節(jié) 醫(yī)學機器人 / 326
一、 醫(yī)學機器人的特點 / 327
二、 醫(yī)學機器人的關(guān)鍵技術(shù) / 327
三、 醫(yī)學機器人的應(yīng)用 / 328
第四節(jié) 醫(yī)藥研發(fā) / 330
一、 靶點篩選 / 331
二、 先導(dǎo)物發(fā)掘 / 332
三、 藥物優(yōu)化 / 333
第十五章 醫(yī)學大數(shù)據(jù)與人工智能的發(fā)展趨勢及挑戰(zhàn)/ 334
第一節(jié) 面臨的問題及挑戰(zhàn) / 334
一、 人工智能算法的局限 / 334
二、 醫(yī)學人工智能的準入和監(jiān)管 / 337
第二節(jié) 發(fā)展趨勢與展望 / 339
一、 智能醫(yī)學 / 339
二、 精準醫(yī)學 / 341
推薦閱讀/ 343
中英文名詞對照索引/ 344