R語言數(shù)據(jù)挖掘(第3版)(基于R應(yīng)用的統(tǒng)計學(xué)叢書)
定 價:59 元
叢書名:基于R應(yīng)用的統(tǒng)計學(xué)叢書
- 作者:薛薇
- 出版時間:2023/1/1
- ISBN:9787300310381
- 出 版 社:中國人民大學(xué)出版社
- 中圖法分類:TP312
- 頁碼:388
- 紙張:
- 版次:3
- 開本:16
全書分為12章,第1章數(shù)據(jù)挖掘與R語言概述,第2章R的數(shù)據(jù)組織和整理,第3章R的數(shù)據(jù)可視化,第4章R的近鄰分析:數(shù)據(jù)預(yù)測,第5章R的決策樹:數(shù)據(jù)預(yù)測,第6章R的人工神經(jīng)網(wǎng)絡(luò):數(shù)據(jù)預(yù)測,第7章R的支持向量機:數(shù)據(jù)預(yù)測,第8章R的一般聚類:揭示數(shù)據(jù)內(nèi)在結(jié)構(gòu),第9章R的特色聚類:揭示數(shù)據(jù)內(nèi)在結(jié)構(gòu),第10章R的關(guān)聯(lián)分析:揭示數(shù)據(jù)關(guān)聯(lián)性,第11章R的模式甄別:診斷異常數(shù)據(jù),第12章R的網(wǎng)絡(luò)分析初步。
第1章 數(shù)據(jù)挖掘與R語言概述
1.1 什么是數(shù)據(jù)挖掘
1.2 數(shù)據(jù)挖掘的結(jié)果
1.2.1 數(shù)據(jù)挖掘結(jié)果的呈現(xiàn)方式
1.2.2 數(shù)據(jù)挖掘結(jié)果的基本特征
1.3 數(shù)據(jù)挖掘能做什么
1.3.1 數(shù)據(jù)預(yù)測
1.3.2 發(fā)現(xiàn)數(shù)據(jù)的內(nèi)在結(jié)構(gòu)
1.3.3 發(fā)現(xiàn)關(guān)聯(lián)性
1.3.4 模式診斷
1.4 數(shù)據(jù)挖掘方法的特點
1.4.1 對目標(biāo)契合度不高的數(shù)據(jù),怎樣的建模策略能夠更好地迎合分析的需要 1.4.2 對于海量、高維數(shù)據(jù),怎樣的建模策略能夠更好地揭示數(shù)據(jù)特征,提高分析效率
1.4.3 對于復(fù)雜類型和關(guān)系數(shù)據(jù),怎樣的建模策略能夠清晰地揭示數(shù)據(jù)的特征 1.5 數(shù)據(jù)挖掘的典型應(yīng)用
1.5.1 數(shù)據(jù)挖掘在客戶細分研究中的應(yīng)用
1.5.2 數(shù)據(jù)挖掘在客戶流失分析中的應(yīng)用
1.5.3 數(shù)據(jù)挖掘在營銷響應(yīng)分析中的應(yīng)用
1.5.4 數(shù)據(jù)挖掘在交叉銷售中的應(yīng)用
1.5.5 數(shù)據(jù)挖掘在欺詐甄別中的應(yīng)用
1.6 R語言入門必備
1.6.1 R的包
1.6.2 R的下載安裝
1.6.3 R起步
1.6.4 R的運行方式和其他
1.7 RStudio簡介
1.8 本章函數(shù)列表
第2章 R的數(shù)據(jù)組織和整理
2.1 R的數(shù)據(jù)對象
2.1.1 從存儲角度劃分R對象
2.1.2 從結(jié)構(gòu)角度劃分R對象
2.1.3 創(chuàng)建和訪問R的數(shù)據(jù)對象
2.2 向量的創(chuàng)建和訪問
2.2.1 創(chuàng)建只包含一個元素的向量
2.2.2 創(chuàng)建包含多個元素的向量
2.2.3 訪問向量中的元素
2.3 矩陣的創(chuàng)建和訪問
2.3.1 創(chuàng)建矩陣
2.3.2 訪問矩陣中的元素
2.4 數(shù)據(jù)框的創(chuàng)建和訪問
2.4.1 創(chuàng)建數(shù)據(jù)框
2.4.2 訪問數(shù)據(jù)框
2.5 數(shù)組和列表的創(chuàng)建和訪問
2.5.1 創(chuàng)建和訪問數(shù)組
2.5.2 創(chuàng)建和訪問列表
2.6 數(shù)據(jù)對象的相互轉(zhuǎn)換
2.6.1 不同存儲類型之間的轉(zhuǎn)換
2.6.2 不同結(jié)構(gòu)類型之間的轉(zhuǎn)換
2.7 導(dǎo)入外部數(shù)據(jù)和保存數(shù)據(jù)
2.7.1 導(dǎo)入文本數(shù)據(jù)
2.7.2 導(dǎo)入SPSS數(shù)據(jù)
2.7.3 利用ODBC導(dǎo)入數(shù)據(jù)庫數(shù)據(jù)和Excel表數(shù)據(jù)
2.7.4 共享R自帶的數(shù)據(jù)包
2.7.5 數(shù)據(jù)保存
2.8 R語言程序設(shè)計基礎(chǔ)
2.8.1 R程序設(shè)計基本概念
2.8.2 R的系統(tǒng)函數(shù)
2.8.3 用戶自定義函數(shù)
2.8.4 R程序的控制結(jié)構(gòu)
2.9 R語言數(shù)據(jù)整理和程序設(shè)計綜合應(yīng)用
2.9.1 數(shù)據(jù)整理基礎(chǔ)綜合應(yīng)用
2.9.2 利用流程控制還原匯總數(shù)據(jù)
2.10 本章函數(shù)列表
第3章 R的數(shù)據(jù)可視化
3.1 繪圖基礎(chǔ)
3.1.1 圖形設(shè)備和圖形文件
3.1.2 圖形組成和圖形參數(shù)
3.2 單變量分布特征的可視化
3.2.1 核密度圖
3.2.2 小提琴圖
3.2.3 克利夫蘭點圖
3.3 多變量聯(lián)合分布特征的可視化
3.3.1 曲面圖和等高線圖
3.3.2 二元核密度曲面圖
3.3.3 雷達圖
3.4 變量間相關(guān)性的可視化
3.4.1 馬賽克圖
3.4.2 散點圖
3.4.3 相關(guān)系數(shù)圖
3.5 本章函數(shù)列表
第4章 R的近鄰分析:數(shù)據(jù)預(yù)測
4.1 近鄰分析: K近鄰法
4.1.1 K近鄰法中的距離
4.1.2 K近鄰法中的近鄰個數(shù)
4.2 K近鄰法的R函數(shù)和應(yīng)用示例
4.2.1 R的K近鄰法函數(shù)
4.2.2 R的K近鄰法示例
4.3 K近鄰法的適用性及特征選擇
4.3.1 K近鄰法的適用性
4.3.2 特征選擇
4.4 本章函數(shù)列表
第5章 R的決策樹:數(shù)據(jù)預(yù)測
5.1 決策樹算法概述
5.1.1 什么是決策樹
5.1.2 決策樹的幾何理解
5.1.3 決策樹的核心問題
5.2 分類回歸樹的生長過程
5.2.1 分類樹的生長過程
5.2.2 回歸樹的生長過程
5.2.3 損失矩陣對分類樹的影響
5.3 分類回歸樹的剪枝
5.3.1 最小代價復(fù)雜度的測度
5.3.2 分類回歸樹后剪枝過程
5.3.3 分類回歸樹的交叉驗證剪枝
5.4 分類回歸樹的R函數(shù)和應(yīng)用示例
5.4.1 分類回歸樹的R函數(shù)
5.4.2 分類回歸樹的應(yīng)用示例
5.5 建立分類回歸樹的組合預(yù)測模型
5.5.1 袋裝技術(shù)
5.5.2 袋裝技術(shù)的R函數(shù)及應(yīng)用示例
5.5.3 提升技術(shù)
5.5.4 提升技術(shù)的R函數(shù)及應(yīng)用示例
5.6 隨機森林
5.6.1 隨機森林概述
5.6.2 隨機森林的R函數(shù)和應(yīng)用示例
5.7 本章函數(shù)列表
第6章 R的人工神經(jīng)網(wǎng)絡(luò):數(shù)據(jù)預(yù)測
6.1 人工神經(jīng)網(wǎng)絡(luò)概述
6.1.1 人工神經(jīng)網(wǎng)絡(luò)的概念和種類
6.1.2 人工神經(jīng)網(wǎng)絡(luò)中的節(jié)點和意義
6.1.3 人工神經(jīng)網(wǎng)絡(luò)建立的一般步驟
6.1.4 感知機模型
6.2 B-P反向傳播網(wǎng)絡(luò)
6.2.1 B-P反向傳播網(wǎng)絡(luò)的特點
6.2.2 B-P反向傳播算法
6.2.3 B-P反向傳播網(wǎng)絡(luò)中的學(xué)習(xí)率
6.3 B-P反向傳播網(wǎng)絡(luò)的R函數(shù)和應(yīng)用示例
6.3.1 neuralnet包中的neuralnet函數(shù)
6.3.2 neuralnet函數(shù)的應(yīng)用示例
6.3.3 利用ROC曲線確定概率分割值
6.3.4 nnet包中的nnet函數(shù)
6.4 本章函數(shù)列表
第7章 R的支持向量機:數(shù)據(jù)預(yù)測
7.1 支持向量分類概述
7.1.1 支持向量分類的基本思路
7.1.2 支持向量分類的三種情況
7.2 線性可分問題下的支持向量分類
7.2.1 如何求解超平面
7.2.2 如何利用超平面進行預(yù)測
7.3 廣義線性可分問題下的支持向量分類
7.3.1 如何求解超平面
7.3.2 可調(diào)參數(shù)的意義
7.4 線性不可分問題下的支持向量分類
7.4.1 線性不可分問題的一般解決方式
7.4.2 支持向量分類克服維災(zāi)難的途徑
7.5 多分類的支持向量分類
7.6 支持向量回歸
7.6.1 支持向量回歸與一般線性回歸
7.6.2 支持向量回歸的基本思路
7.7 R的支持向量機及應(yīng)用示例
7.7.1 R的支持向量機函數(shù)
7.7.2 利用R模擬線性可分下的支持向量分類
7.7.3 利用R模擬線性不可分下的支持向量分類
7.7.4 利用R模擬多分類的支持向量分類
7.8 本章函數(shù)列表
第8章 R的一般聚類:揭示數(shù)據(jù)內(nèi)在結(jié)構(gòu)
8.1 聚類分析概述
8.1.1 聚類分析的目的
8.1.2 聚類算法概述
8.2 基于質(zhì)心的聚類模型:K-Means聚類
8.2.1 K-Means聚類中的距離測度
8.2.2 K-Means聚類過程
8.2.3 R的K-Means聚類函數(shù)
8.2.4 K-Means聚類的R模擬和應(yīng)用示例
8.3 基于質(zhì)心的聚類模型:PAM聚類
8.3.1 PAM聚類過程
8.3.2 R的PAM聚類函數(shù)和應(yīng)用示例
8.4 基于聯(lián)通性的聚類模型:層次聚類
8.4.1 層次聚類的基本過程
8.4.2 層次聚類中距離的聯(lián)通性測度
8.4.3 層次聚類的R函數(shù)和應(yīng)用示例
8.5 基于統(tǒng)計分布的聚類模型:EM聚類
8.5.1 基于統(tǒng)計分布的聚類模型的出發(fā)點:有限混合分布
8.5.2 EM聚類
8.5.3 R的EM聚類函數(shù)和應(yīng)用示例
8.6 本章函數(shù)列表
第9章 R的特色聚類:揭示數(shù)據(jù)內(nèi)在結(jié)構(gòu)
9.1 BIRCH聚類
9.1.1 BRICH聚類的特點
9.1.2 BIRCH算法中的聚類特征和聚類特征樹
9.1.3 BIRCH的聚類過程
9.1.4 BRICH聚類的R函數(shù)和應(yīng)用示例
9.2 SOM網(wǎng)絡(luò)聚類
9.2.1 SOM網(wǎng)絡(luò)聚類設(shè)計的出發(fā)點
9.2.2 SOM網(wǎng)絡(luò)的拓撲結(jié)構(gòu)和聚類原理
9.2.3 SOM網(wǎng)絡(luò)聚類的R函數(shù)和應(yīng)用示例
9.2.4 SOM網(wǎng)絡(luò)聚類應(yīng)用:手寫郵政編碼識別
9.2.5 拓展SOM網(wǎng)絡(luò):數(shù)據(jù)預(yù)測
9.3 基于密度的聚類模型:DBSCAN聚類
9.3.1 DBSCAN聚類原理
9.3.2 DBSCAN聚類的R函數(shù)和應(yīng)用示例
9.4 本章函數(shù)列表
第10章 R的關(guān)聯(lián)分析:揭示數(shù)據(jù)關(guān)聯(lián)性
10.1 簡單關(guān)聯(lián)規(guī)則及其測度
10.1.1 什么是簡單關(guān)聯(lián)規(guī)則
10.1.2 簡單關(guān)聯(lián)規(guī)則的有效性和實用性
10.2 Apriori算法及應(yīng)用示例
10.2.1 搜索頻繁項集
10.2.2 依據(jù)頻繁項集產(chǎn)生簡單關(guān)聯(lián)規(guī)則
10.2.3 Apriori算法的R函數(shù)和應(yīng)用示例
10.2.4 簡單關(guān)聯(lián)規(guī)則的可視化R函數(shù)和應(yīng)用示例
10.3 簡單關(guān)聯(lián)分析的應(yīng)用示例
10.3.1 發(fā)現(xiàn)連帶銷售商品
10.3.2 顧客選擇性傾向?qū)Ρ?
10.4 本章函數(shù)列表
第11章 R的模式甄別:診斷異常數(shù)據(jù)
11.1 模式甄別方法和評價概述
11.1.1 模式甄別方法
11.1.2 模式甄別結(jié)果及評價
11.2 模式甄別的無監(jiān)督偵測方法及應(yīng)用示例
11.2.1 依概率偵測模式及R應(yīng)用示例
11.2.2 依距離偵測模式:DB方法及 R應(yīng)用示例
11.2.3 依密度偵測模式:LOF方法及 R應(yīng)用示例
11.3 模式甄別的有監(jiān)督偵測方法及應(yīng)用示例
11.3.1 樸素貝葉斯分類法
11.3.2 Logistic回歸及示例
11.3.3 非平衡數(shù)據(jù)集的SMOTE處理
11.4 模式甄別的半監(jiān)督偵測方法及應(yīng)用示例
11.4.1 半監(jiān)督分類:自訓(xùn)練分類模型
11.4.2 自訓(xùn)練分類模型的R函數(shù)及應(yīng)用示例
11.5 本章函數(shù)列表
第12章 R的網(wǎng)絡(luò)分析初步
12.1 網(wǎng)絡(luò)的定義、表示及構(gòu)建
12.1.1 網(wǎng)絡(luò)的圖論定義及R函數(shù)
12.1.2 網(wǎng)絡(luò)的矩陣表示方式及 R函數(shù)
12.1.3 R的網(wǎng)絡(luò)數(shù)據(jù)文件和建立網(wǎng)絡(luò)對象
12.1.4 R的網(wǎng)絡(luò)可視化
12.2 網(wǎng)絡(luò)節(jié)點重要性的測度
12.2.1 度和測地線距離
12.2.2 節(jié)點“中心”作用的測度:點度中心度和接近中心度
12.2.3 節(jié)點“樞紐”作用的測度:中間中心度
12.2.4 節(jié)點重要性的其他方面:結(jié)構(gòu)洞和關(guān)節(jié)點、特征向量中心度和 PageRank得分
12.3 網(wǎng)絡(luò)子群構(gòu)成特征研究
12.3.1 二元關(guān)系和三元關(guān)系及 R函數(shù)
12.3.2 派系和 k核及R函數(shù)
12.3.3 社區(qū)和組件及R函數(shù)
12.4 網(wǎng)絡(luò)整體特征刻畫
12.4.1 網(wǎng)絡(luò)整體特征的測度
12.4.2 網(wǎng)絡(luò)特征的各種分布和度量
12.5 主要網(wǎng)絡(luò)類型及特點
12.5.1 規(guī)則網(wǎng)絡(luò)
12.5.2 隨機網(wǎng)絡(luò)
12.5.3 小世界網(wǎng)絡(luò)
12.5.4 無標(biāo)度網(wǎng)絡(luò)
12.6 本章函數(shù)列表