關(guān)于我們
書單推薦
新書推薦
|
Hadoop+Spark大數(shù)據(jù)分析實(shí)戰(zhàn) 本書是Hadoop Spark大數(shù)據(jù)分析技術(shù)入門書,基于Hadoop和Spark兩大框架體系的3.2版本,以通俗易懂的方式介紹Hadoop Spark原生態(tài)組件的原理、集群搭建、實(shí)戰(zhàn)操作,以及整個(gè)Hadoop生態(tài)系統(tǒng)主流的大數(shù)據(jù)分析技術(shù)。 本書共分14章。第1章講解Hadoop框架及新版本特性,并詳細(xì)講解大數(shù)據(jù)分析環(huán)境的搭建工作,包括Linux操作系統(tǒng)的安裝、SSH工具使用和配置等;第2章講解Hadoop偽分布式的安裝和開發(fā)體驗(yàn),使讀者熟悉Hadoop大數(shù)據(jù)開發(fā)兩大核心組件,即HDFS和MapReduce;第3~12章講解Hadoop生態(tài)系統(tǒng)各框架HDFS、MapReduce、輸入輸出、Hadoop集群配置、高可用集群、HBase、Hive、數(shù)據(jù)實(shí)時(shí)處理系統(tǒng)Flume,以及Spark框架數(shù)據(jù)處理、機(jī)器學(xué)習(xí)等實(shí)戰(zhàn)技術(shù),并通過實(shí)際案例加深對(duì)各個(gè)框架的理解與應(yīng)用;第13~14章分別通過影評(píng)分析、旅游酒店評(píng)價(jià)分析實(shí)戰(zhàn)項(xiàng)目來(lái)貫穿大數(shù)據(jù)分析的完整流程。 本書可以作為大數(shù)據(jù)分析初學(xué)者的入門指導(dǎo)書,也可以作為大數(shù)據(jù)開發(fā)人員的參考手冊(cè),同時(shí)也適合作為高等院校大數(shù)據(jù)相關(guān)專業(yè)的教材或教學(xué)參考書。
你還可能感興趣
我要評(píng)論
|