關(guān)于我們
書單推薦
新書推薦

Hadoop+Spark大數(shù)據(jù)分析實(shí)戰(zhàn)

Hadoop+Spark大數(shù)據(jù)分析實(shí)戰(zhàn)

定  價(jià):69 元

叢書名:大數(shù)據(jù)技術(shù)叢書

        

  • 作者:遲殿委
  • 出版時(shí)間:2022/7/1
  • ISBN:9787302608844
  • 出 版 社:清華大學(xué)出版社
  • 中圖法分類:TP274 
  • 頁(yè)碼:
  • 紙張:膠版紙
  • 版次:
  • 開本:16開
9
7
6
8
0
7
8
3
8
0
4
2
4

本書是Hadoop Spark大數(shù)據(jù)分析技術(shù)入門書,基于Hadoop和Spark兩大框架體系的3.2版本,以通俗易懂的方式介紹Hadoop Spark原生態(tài)組件的原理、集群搭建、實(shí)戰(zhàn)操作,以及整個(gè)Hadoop生態(tài)系統(tǒng)主流的大數(shù)據(jù)分析技術(shù)。 本書共分14章。第1章講解Hadoop框架及新版本特性,并詳細(xì)講解大數(shù)據(jù)分析環(huán)境的搭建工作,包括Linux操作系統(tǒng)的安裝、SSH工具使用和配置等;第2章講解Hadoop偽分布式的安裝和開發(fā)體驗(yàn),使讀者熟悉Hadoop大數(shù)據(jù)開發(fā)兩大核心組件,即HDFS和MapReduce;第3~12章講解Hadoop生態(tài)系統(tǒng)各框架HDFS、MapReduce、輸入輸出、Hadoop集群配置、高可用集群、HBase、Hive、數(shù)據(jù)實(shí)時(shí)處理系統(tǒng)Flume,以及Spark框架數(shù)據(jù)處理、機(jī)器學(xué)習(xí)等實(shí)戰(zhàn)技術(shù),并通過實(shí)際案例加深對(duì)各個(gè)框架的理解與應(yīng)用;第13~14章分別通過影評(píng)分析、旅游酒店評(píng)價(jià)分析實(shí)戰(zhàn)項(xiàng)目來(lái)貫穿大數(shù)據(jù)分析的完整流程。 本書可以作為大數(shù)據(jù)分析初學(xué)者的入門指導(dǎo)書,也可以作為大數(shù)據(jù)開發(fā)人員的參考手冊(cè),同時(shí)也適合作為高等院校大數(shù)據(jù)相關(guān)專業(yè)的教材或教學(xué)參考書。

 你還可能感興趣
 我要評(píng)論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容