本書作者提供了40多種可以立即使用的工具的示例。軟件測試專業(yè)人員和初學(xué)者都將獲得執(zhí)行性能、安全性和可訪問性測試的技能, 包括探索性測試、測試自動化、跨功能測試、數(shù)據(jù)測試、移動測試等。你還將學(xué)習(xí)將它們組合到持續(xù)集成管道中以獲得更快的反饋。通過本書, 你將能夠處理具有挑戰(zhàn)性的開發(fā)工作流程, 同時注重質(zhì)量。通過這本書, 你將學(xué)會: 學(xué)習(xí)如何使用各種測試類型, 以在項目中獲得最高質(zhì)量。
1.內(nèi)容全面,循序漸進。本書圍繞R語言數(shù)據(jù)分析相關(guān)語法和常用數(shù)據(jù)分析包展開,內(nèi)容由淺入深,非常適合初學(xué)者學(xué)習(xí)。
2.案例豐富,實用性強。書中選取了不同場合下的各種數(shù)據(jù)分析案例,不僅中間穿插有小案例,書末還有綜合性的大案例,通過案例實操,讓讀者能夠快速掌握所學(xué)知識,并應(yīng)用到實際工作中。
3.全彩圖解,直觀易懂。本書采用全彩印刷,書中通過大量的彩色圖片展示,讓讀者一目了然,迅速了解并掌握具體的操作方法、步驟以及實現(xiàn)效果。
4.學(xué)習(xí)資源,超值贈送。重要知識點及實戰(zhàn)案例均配有二維碼視頻講解,掃碼觀看,學(xué)習(xí)更便捷。此外,還附贈相關(guān)實例素材源文件、電子書等資源,方便實踐練習(xí)與知識拓展。
第1章 R語言與數(shù)據(jù)分析 001
1.1 R與RStudio安裝 002
1.1.1 R語言安裝 002
1.1.2 RStudio安裝 003
1.1.3 R包安裝 005
1.2 數(shù)據(jù)分析簡介 007
1.2.1 數(shù)據(jù)分析的內(nèi)容 007
1.2.2 數(shù)據(jù)分析工作流程 010
1.2.3 什么是數(shù)據(jù)分析師 012
1.2.4 數(shù)據(jù)分析師需要的技術(shù)和知識 012
1.3 R語言與數(shù)據(jù)分析 012
1.3.1 R語言為何適合數(shù)據(jù)分析 012
1.3.2 R語言常用數(shù)據(jù)分析包 013
1.4 本章小結(jié) 016
第2章 R語言快速入門 017
2.1 向量的數(shù)據(jù)類型 018
2.1.1 數(shù)值型 018
2.1.2 邏輯值型 020
2.1.3 字符型 020
2.1.4 因子型 022
2.2 矩陣與高維數(shù)組 023
2.2.1 矩陣 023
2.2.2 高維數(shù)組 025
2.3 數(shù)據(jù)框與列表 027
2.3.1 數(shù)據(jù)框 027
2.3.2 列表 030
2.4 條件判斷與循環(huán)語句 032
2.4.1 條件判斷語句 032
2.4.2 循環(huán)語句 033
2.5 編寫自己的函數(shù) 035
2.6 本章小結(jié) 037
第3章 R語言數(shù)據(jù)管理與操作 039
3.1 數(shù)據(jù)導(dǎo)入與保存 040
3.1.1 數(shù)據(jù)導(dǎo)入 040
3.1.2 數(shù)據(jù)保存 042
3.2 處理缺失值 042
3.2.1 缺失值發(fā)現(xiàn) 043
3.2.2 缺失值填充 044
3.3 數(shù)據(jù)操作 046
3.3.1 數(shù)據(jù)并行計算 046
3.3.2 數(shù)據(jù)選擇、過濾、分組 050
3.3.3 數(shù)據(jù)融合 059
3.3.4 進行長寬數(shù)據(jù)轉(zhuǎn)換 061
3.4 其它數(shù)據(jù)處理 062
3.4.1 lubridate包處理時間數(shù)據(jù) 062
3.4.2 stringr包處理文本數(shù)據(jù) 066
3.5 本章小結(jié) 072
第4章 R語言數(shù)據(jù)可視化 073
4.1 R語言基礎(chǔ)繪圖系統(tǒng) 074
4.1.1 基礎(chǔ)繪圖系統(tǒng)可視化基本設(shè)置 074
4.1.2 基礎(chǔ)繪圖系統(tǒng)可視化實戰(zhàn) 078
4.2 ggplot2包數(shù)據(jù)可視化 084
4.2.1 使用圖層構(gòu)建圖像 085
4.2.2 ggplot2可視化進階 092
4.3 R語言其它數(shù)據(jù)可視化包 100
4.3.1 GGally包數(shù)據(jù)可視化 100
4.3.2 ggChernoff包數(shù)據(jù)可視化 103
4.3.3 ggTimeSeries包數(shù)據(jù)可視化 104
4.3.4 pheatmap包數(shù)據(jù)可視化 106
4.3.5 igraph包數(shù)據(jù)可視化 108
4.3.6 wordcloud包數(shù)據(jù)可視化 111
4.3.7 ComplexUpset包數(shù)據(jù)可視化 112
4.4 本章小結(jié) 114
第5章 R語言數(shù)據(jù)分析 115
5.1 相關(guān)性分析 116
5.1.1 相關(guān)系數(shù)介紹 116
5.1.2 相關(guān)系數(shù)計算與可視化分析 117
5.2 方差分析 118
5.2.1 單因素方差分析 118
5.2.2 雙因素方差分析 120
5.3 降維 123
5.3.1 常用數(shù)據(jù)降維算法 123
5.3.2 數(shù)據(jù)降維實戰(zhàn) 125
5.4 回歸分析 133
5.4.1 常用回歸算法 133
5.4.2 回歸評價指標 135
5.4.3 數(shù)據(jù)回歸實戰(zhàn) 136
5.5 分類 147
5.5.1 常用分類算法 147
5.5.2 分類評價指標 153
5.5.3 數(shù)據(jù)分類實戰(zhàn) 154
5.6 聚類 165
5.6.1 常用數(shù)據(jù)聚類算法 165
5.6.2 聚類評價指標 168
5.6.3 數(shù)據(jù)聚類實戰(zhàn) 168
5.7 時間序列預(yù)測 173
5.7.1 時序預(yù)測的相關(guān)模型 173
5.7.2 時間序列預(yù)測實戰(zhàn) 176
5.8 本章小結(jié) 185
第6章 綜合案例1:中藥材鑒別 187
6.1 聚類算法鑒別藥材種類 189
6.1.1 數(shù)據(jù)探索與可視化 189
6.1.2 數(shù)據(jù)降維與特征提取 192
6.1.3 數(shù)據(jù)聚類 193
6.2 分類算法鑒別藥材的產(chǎn)地 195
6.2.1 數(shù)據(jù)導(dǎo)入與探索 195
6.2.2 選擇數(shù)據(jù)中的重要特征 197
6.2.3 鑒別藥材的產(chǎn)地 200
6.3 分類算法鑒別藥材的類別 202
6.3.1 數(shù)據(jù)導(dǎo)入與探索 202
6.3.2 數(shù)據(jù)特征降維 204
6.3.3 預(yù)測藥材的類別 205
6.4 分類算法預(yù)測藥材的產(chǎn)地 210
6.4.1 數(shù)據(jù)導(dǎo)入與探索 210
6.4.2 數(shù)據(jù)特征降維 212
6.4.3 預(yù)測藥材的產(chǎn)地 213
6.5 本章小結(jié) 220
第7章 綜合案例2:抗乳腺癌候選藥物分析 221
7.1 數(shù)據(jù)特征提取 224
7.1.1 數(shù)據(jù)可視化探索 225
7.1.2 特征選擇 228
7.2 回歸模型預(yù)測生物活性 232
7.2.1 利用隨機森林提取的特征建立回歸模型 232
7.2.2 利用Lasso回歸提取的特征建立回歸模型 235
7.3 分類模型預(yù)測二分類變量 236
7.3.1 通過遞歸特征消除提取特征建立分類模型 236
7.3.2 通過主成分降維提取特征建立分類模型 241
7.4 本章小結(jié) 244
第8章 綜合案例3:文本內(nèi)容數(shù)據(jù)分析 245
8.1 文本預(yù)處理 248
8.1.1 讀取文本數(shù)據(jù) 248
8.1.2 文本數(shù)據(jù)清洗 249
8.2 特征提取與可視化 252
8.2.1 TF特征 253
8.2.2 TF-IDF特征 254
8.2.3 詞云可視化 255
8.3 文本聚類 256
8.3.1 LDA主題模型聚類 256
8.3.2 K均值聚類 261
8.4 對文本進行分類 264
8.4.1 基于TF-IDF特征建立分類模型 264
8.4.2 基于TF特征建立分類模型 266
8.5 中文文本數(shù)據(jù)分析 268
8.5.1 《三國演義》文本數(shù)據(jù)預(yù)處理 269
8.5.2 對文本數(shù)據(jù)探索與特征提取 270
8.5.3 建立LDA主題模型 273
8.6 本章小結(jié) 276
參考文獻 277