機(jī)械工業(yè)出版社本教材首先介紹了數(shù)據(jù)分析的基本概念和方法,然后通過(guò)大量實(shí)例介紹了如何使用Matlab實(shí)現(xiàn)數(shù)據(jù)分析,并深入淺出地介紹了數(shù)據(jù)建模過(guò)程中的有關(guān)方法。本教材共分8章,主要內(nèi)容包括:數(shù)據(jù)的基本概念及其應(yīng)用、Matlab基礎(chǔ)、隨機(jī)模擬、數(shù)據(jù)預(yù)處理、數(shù)據(jù)探索與分析、多元線性回歸模型、聚類分析和分類。本教材可作為職業(yè)院校計(jì)算機(jī)相關(guān)專業(yè)的教學(xué)用書,也可供相關(guān)技術(shù)人員參考。
前言
第1章數(shù)據(jù)的基本概念及其應(yīng)用
11數(shù)據(jù)與數(shù)據(jù)處理
111數(shù)據(jù)的相關(guān)基本概念
112數(shù)據(jù)處理的主要概念
113數(shù)據(jù)處理的流程
114數(shù)據(jù)處理的誤區(qū)
12數(shù)據(jù)處理涉及的主要領(lǐng)域
121統(tǒng)計(jì)學(xué)
122數(shù)據(jù)挖掘
123云計(jì)算
13數(shù)據(jù)處理的主要方法
131數(shù)據(jù)采集
132數(shù)據(jù)預(yù)處理
133數(shù)據(jù)分析
134數(shù)據(jù)挖掘算法
第2章Matlab基礎(chǔ)
21Matlab簡(jiǎn)介
211Matlab的特點(diǎn)
212Matlab窗口簡(jiǎn)介
22數(shù)組及其運(yùn)算
221變量和數(shù)組
222變量的初始化
223多維數(shù)組
224子數(shù)組
225單元陣列
226顯示輸出數(shù)據(jù)
227數(shù)據(jù)文件
228數(shù)組運(yùn)算和矩陣運(yùn)算
229內(nèi)置函數(shù)
23作圖入門
231簡(jiǎn)單的直角坐標(biāo)系作圖
232作圖的附加特性
24Matlab程序設(shè)計(jì)
241關(guān)系運(yùn)算符和邏輯運(yùn)算符
242選擇結(jié)構(gòu)
243循環(huán)結(jié)構(gòu)
25自定義函數(shù)
第3章隨 機(jī) 模 擬
31隨機(jī)數(shù)的生成
32蒙特卡羅模擬
321蒙特卡羅模擬估計(jì)面積
322蒙特卡羅模擬尋求近似圓周率
323蒙特卡羅模擬解決生日問(wèn)題
33隨機(jī)行為的模擬
34蒙特卡羅模擬應(yīng)用案例:理發(fā)店系統(tǒng)研究
Matlab數(shù)據(jù)分析第1章數(shù)據(jù)的基本概念及其應(yīng)用第4章數(shù)據(jù)預(yù)處理
41認(rèn)識(shí)數(shù)據(jù)
411屬性
412離散屬性和連續(xù)屬性
42數(shù)據(jù)預(yù)處理概述
421數(shù)據(jù)清洗
422數(shù)據(jù)集成
423數(shù)據(jù)歸約
424數(shù)據(jù)變換
43Matlab與Excel的數(shù)據(jù)交互
431以交互方式導(dǎo)入數(shù)據(jù)
432讀取和寫入表
433大型文件和大型數(shù)據(jù)簡(jiǎn)介
434數(shù)據(jù)的清理、平滑和分組等
第5章數(shù)據(jù)探索與分析
51數(shù)據(jù)的特征統(tǒng)計(jì)量
511中心度量趨勢(shì):均值、中位數(shù)、眾數(shù)
512常用的變異程度度量
513分布形態(tài)
52基本統(tǒng)計(jì)描述的可視化
521分類型數(shù)據(jù)頻數(shù)分布及其可視化
522直方圖
523分位數(shù)圖和經(jīng)驗(yàn)累計(jì)分布函數(shù)
524分位數(shù)分位數(shù)圖——qq圖
525箱形圖
526散點(diǎn)圖
53度量數(shù)據(jù)的相似性和相異性
531數(shù)據(jù)矩陣、相異性矩陣、相似性矩陣
532數(shù)值屬性的相似性:相關(guān)系數(shù)
533數(shù)值屬性的相異性:距離
54數(shù)據(jù)降維——主成分分析
第6章多元線性回歸模型
61概述
62一元曲線擬合
621案例1——百貨商場(chǎng)銷售額
622確定最優(yōu)擬合
623導(dǎo)出模型到工作空間
63多元線性回歸模型
631案例2——牙膏的銷售量
632案例3——自變量含有分類變量的處理
64逐步回歸模型
第7章聚 類 分 析
71簡(jiǎn)介
711聚類分析的類型
712聚類分析的依據(jù)
72譜系聚類
73k均值聚類
731k均值聚類概述
732k均值聚類算法的Matlab函數(shù)
733k均值聚類算法的特點(diǎn)
734k均值聚類算法綜合應(yīng)用
74層次聚類
741概述
742層次聚類算法的Matlab實(shí)現(xiàn)
743層次聚類算法的特點(diǎn)
75高斯混合模型聚類
751簡(jiǎn)介
752高斯混合模型聚類算法的Matlab實(shí)現(xiàn)
第8章分類
81分類算法簡(jiǎn)介
811邏輯回歸分類算法
812K近鄰分類算法
813支持向量機(jī)分類算法
814人工神經(jīng)網(wǎng)絡(luò)分類算法
815樸素貝葉斯分類算法
816判別分析分類算法
817決策樹(shù)分類算法
818集成學(xué)習(xí)分類算法
82分類的評(píng)判
821評(píng)判指標(biāo)
822ROC曲線和AUC
83判別分析分類的具體應(yīng)用
831判別分析的定義、特點(diǎn)和類型
832距離判別
833貝葉斯判別
84使用Classification Learner App實(shí)現(xiàn)分類
參 考 文 獻(xiàn)