關(guān)于我們
書單推薦
新書推薦

大數(shù)據(jù)技術(shù)入門——Hadoop+Spark

大數(shù)據(jù)技術(shù)入門——Hadoop+Spark

定  價(jià):49.9 元

叢書名:大數(shù)據(jù)與人工智能技術(shù)叢書

        

  • 作者:于海浩 劉志坤 主編 韓詠 孫栩 副主編
  • 出版時(shí)間:2022/1/1
  • ISBN:9787302591818
  • 出 版 社:清華大學(xué)出版社
  • 中圖法分類:TP274 
  • 頁碼:208
  • 紙張:
  • 版次:1
  • 開本:
9
7
5
8
9
7
1
3
8
0
1
2
8
本書基礎(chǔ)理論、應(yīng)用開發(fā)以及實(shí)際案例相結(jié)合,圍繞Hadoop、Spark生態(tài)圈循序漸進(jìn)地介紹關(guān)于大數(shù)據(jù)技術(shù)領(lǐng)域中的基礎(chǔ)知識(shí)、應(yīng)用開發(fā)技術(shù)和基于Spark的常見機(jī)器學(xué)習(xí)算法,最后以兩個(gè)實(shí)戰(zhàn)案例全面、系統(tǒng)地應(yīng)用了本書介紹的基礎(chǔ)知識(shí)和應(yīng)用開發(fā)方法。全書共14章,分別為大數(shù)據(jù)概述、Hadoop簡(jiǎn)介及安裝部署、HDFS、MapReduce計(jì)算框架、Hive數(shù)據(jù)倉(cāng)庫(kù)、HBase分布式數(shù)據(jù)庫(kù)、Spark基礎(chǔ)、Spark RDD彈性分布式數(shù)據(jù)集、Spark SQL、Spark Streaming實(shí)時(shí)計(jì)算框架、Spark Streaming與Flume、Kafka的整合、Spark MLlib 機(jī)器學(xué)習(xí)、實(shí)戰(zhàn)案例——分布式優(yōu)惠券后臺(tái)應(yīng)用系統(tǒng)和實(shí)戰(zhàn)案例——新聞話題實(shí)時(shí)統(tǒng)計(jì)分析系統(tǒng),書中的每個(gè)知識(shí)點(diǎn)都有相應(yīng)的實(shí)現(xiàn)代碼和實(shí)例。
本書主要面向廣大從事大數(shù)據(jù)分析、應(yīng)用開發(fā)、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘的專業(yè)人員以及從事高校信息技術(shù)專業(yè)的教師和高等院校的在讀學(xué)生及相關(guān)領(lǐng)域的廣大科研人員。
 你還可能感興趣
 我要評(píng)論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容