王偉軍、劉蕤、周光有編*的《大數(shù)據(jù)分析》結(jié)合大數(shù)據(jù)分析實操和商務(wù)應(yīng)用場景,以大數(shù)據(jù)分析流程為主線,按照“原理、方法、工具和應(yīng)用”組織內(nèi)容體系,主要內(nèi)容包括:大數(shù)據(jù)生態(tài)系統(tǒng)和大數(shù)據(jù)分析的環(huán)境搭建、大數(shù)據(jù)收集、大數(shù)據(jù)計算、大數(shù)據(jù)挖掘、大數(shù)據(jù)可視化,通過在用戶搜索行為分析和個性化推薦系統(tǒng)兩個現(xiàn)實場景中的實驗,闡述并展示了大數(shù)據(jù)分析的環(huán)境配置和大數(shù)據(jù)分析的應(yīng)用實例。
本書以附錄形式呈現(xiàn)大數(shù)據(jù)分析實驗環(huán)境搭建、Hadoop組件參數(shù)配置,以及大數(shù)據(jù)分析相關(guān)學(xué)習(xí)資源。此外,我們還制作了配套PPT課件、案例、習(xí)題、試卷及答案等電子資源,以及實驗所用完整數(shù)據(jù),方便讀者動手實踐書中所講解的實例。
本書適合于電子商務(wù)、信息管理與信息系統(tǒng)及相關(guān)專業(yè)的大學(xué)生和研究生學(xué)習(xí),以及對大數(shù)據(jù)分析感興趣和有志于從事數(shù)據(jù)分析工作的讀者閱讀使用。
第1章大數(shù)據(jù)概述
1.1大數(shù)據(jù)的背景
1.2大數(shù)據(jù)的基本概念
1.3大數(shù)據(jù)的來源及分類
1.4大數(shù)據(jù)分析的價值
1.5案例:上海聯(lián)通大數(shù)據(jù)應(yīng)用實踐
【本章小結(jié)】
【關(guān)鍵術(shù)語】
【復(fù)習(xí)思考題】
第2章大數(shù)據(jù)生態(tài)系統(tǒng)
2.1.Hadoop生態(tài)系統(tǒng)
2.2Spark生態(tài)系統(tǒng)
2.3Hadoop和Spark的應(yīng)用案例
【本章小結(jié)】
【關(guān)鍵術(shù)語】
【復(fù)習(xí)思考題】
第3章大數(shù)據(jù)收集
3.1Flume
3.2Kafka
3.3Kafka和Flume的區(qū)別
【本章小結(jié)】
【關(guān)鍵術(shù)語】
【復(fù)習(xí)思考題】
第4章大數(shù)據(jù)計算
4.1MapReduce
4.2Impala
4.3Stolln
【本章小結(jié)】
【關(guān)鍵術(shù)語】
【復(fù)習(xí)思考題】
第5章大數(shù)據(jù)挖掘
5.1機器學(xué)習(xí)
5.2Mahout
5.3Weka
5.4R語言
【本章小結(jié)】
【關(guān)鍵術(shù)語】
【復(fù)習(xí)思考題】
第6章大數(shù)據(jù)可視化
6.1Tableau
6.2ECharts
6.3大數(shù)據(jù)可視化應(yīng)用實例
【本章小結(jié)】
【關(guān)鍵術(shù)語】
【復(fù)習(xí)思考題】
第7章大規(guī)模搜索日志用戶行為分析
7.1Linux環(huán)境下進行數(shù)據(jù)預(yù)處理
7.2基于Hive構(gòu)建日志數(shù)據(jù)的數(shù)據(jù)倉庫
7.3搜索日志數(shù)據(jù)分析
【本章小結(jié)】
【關(guān)鍵術(shù)語】
【復(fù)習(xí)思考題】
第8章電子商務(wù)大數(shù)據(jù)推薦系統(tǒng)
8.1電子商務(wù)推薦系統(tǒng)
8.2數(shù)據(jù)預(yù)處理
8.3Mahout基于項目的推薦方法
【本章小結(jié)】
【關(guān)鍵術(shù)語】
【復(fù)習(xí)思考題】
附錄
附錄1Flume中組件的度量
附錄2Linux系統(tǒng)下配置實驗環(huán)境
附錄3安裝部署Hive
附錄4Mahout實驗環(huán)境配置及數(shù)據(jù)準備
附錄5大數(shù)據(jù)分析學(xué)習(xí)資源
參考文獻