R語(yǔ)言:從數(shù)據(jù)思維到數(shù)據(jù)實(shí)戰(zhàn)
如何從數(shù)據(jù)中挖掘價(jià)值?一是要鍛煉數(shù)據(jù)思維;二是需要選擇一個(gè)便利快捷的工具。R語(yǔ)言在數(shù)據(jù)分析方面有著靈活、高效的優(yōu)勢(shì)。本書以R語(yǔ)言為基礎(chǔ),深度講解從數(shù)據(jù)思維到實(shí)戰(zhàn)的全過程。在章節(jié)組織上,本從R語(yǔ)言簡(jiǎn)介及優(yōu)勢(shì)入手,再到數(shù)據(jù)讀取、清洗、描述、建模等數(shù)據(jù)分析的各個(gè)環(huán)節(jié),由淺入深逐個(gè)講解,是一本實(shí)務(wù)分析中的“R語(yǔ)言指南”。同時(shí),本書采用大量實(shí)際案例輔以說明,既有助于上手分析,也可用于教學(xué)使用。
本書所有代碼、數(shù)據(jù)可在狗熊會(huì)官網(wǎng)(http://www.xiong99.com.cn/create.php)免費(fèi)下載。同時(shí),關(guān)注狗熊會(huì)微信公眾號(hào),可獲取更多擴(kuò)展資源。
朱雪寧 復(fù)旦大學(xué)大數(shù)據(jù)學(xué)院助理教授。博士畢業(yè)于北京大學(xué)光華管理學(xué)院商務(wù)統(tǒng)計(jì)系,后于賓州州立大學(xué)(Pennsylvania State University)從事博士后研究工作。狗熊會(huì)創(chuàng)始團(tuán)隊(duì)成員、《R語(yǔ)千尋》專欄負(fù)責(zé)人;統(tǒng)計(jì)之都核心成員、編輯部主編。研究上關(guān)注社交網(wǎng)絡(luò)數(shù)據(jù)分析、高維數(shù)據(jù)分析等問題。
第1章初識(shí)R語(yǔ)言
1.1初識(shí)R語(yǔ)言
1.2安裝R語(yǔ)言
1.3獲取R幫助文檔
第2章R語(yǔ)言數(shù)據(jù)操作
2.1R中的數(shù)據(jù)類型
2.2數(shù)據(jù)讀入
第3章R語(yǔ)言與統(tǒng)計(jì)分析
3.1描述分析及可視化
3.2統(tǒng)計(jì)檢驗(yàn)
3.3回歸分析
3.4代碼規(guī)范與文檔撰寫
第4章R語(yǔ)言與非結(jié)構(gòu)化數(shù)據(jù)分析
4.1文本分析
4.2圖像分析
第5章R語(yǔ)言與機(jī)器學(xué)習(xí)
5.1機(jī)器學(xué)習(xí)概述
5.2數(shù)據(jù)預(yù)處理
5.3模型訓(xùn)練與調(diào)參
5.4模型訓(xùn)練與集成
第6章R語(yǔ)言爬蟲初介
6.1HTML基礎(chǔ)與R語(yǔ)言解析
6.2XML與XPath表達(dá)式以及R爬蟲應(yīng)用
6.3HTTP協(xié)議
6.4AJAX與網(wǎng)頁(yè)動(dòng)態(tài)加載
6.5正則表達(dá)式與字符串處理函數(shù)
6.6R語(yǔ)言爬蟲實(shí)戰(zhàn)