關(guān)于我們
書單推薦
新書推薦
|
大數(shù)據(jù)技術(shù)入門——Hadoop+Spark
本書基礎(chǔ)理論、應(yīng)用開發(fā)以及實(shí)際案例相結(jié)合,圍繞Hadoop、Spark生態(tài)圈循序漸進(jìn)地介紹關(guān)于大數(shù)據(jù)技術(shù)領(lǐng)域中的基礎(chǔ)知識(shí)、應(yīng)用開發(fā)技術(shù)和基于Spark的常見機(jī)器學(xué)習(xí)算法,最后以兩個(gè)實(shí)戰(zhàn)案例全面、系統(tǒng)地應(yīng)用了本書介紹的基礎(chǔ)知識(shí)和應(yīng)用開發(fā)方法。全書共14章,分別為大數(shù)據(jù)概述、Hadoop簡(jiǎn)介及安裝部署、HDFS、MapReduce計(jì)算框架、Hive數(shù)據(jù)倉(cāng)庫(kù)、HBase分布式數(shù)據(jù)庫(kù)、Spark基礎(chǔ)、Spark RDD彈性分布式數(shù)據(jù)集、Spark SQL、Spark Streaming實(shí)時(shí)計(jì)算框架、Spark Streaming與Flume、Kafka的整合、Spark MLlib 機(jī)器學(xué)習(xí)、實(shí)戰(zhàn)案例——分布式優(yōu)惠券后臺(tái)應(yīng)用系統(tǒng)和實(shí)戰(zhàn)案例——新聞話題實(shí)時(shí)統(tǒng)計(jì)分析系統(tǒng),書中的每個(gè)知識(shí)點(diǎn)都有相應(yīng)的實(shí)現(xiàn)代碼和實(shí)例。
本書主要面向廣大從事大數(shù)據(jù)分析、應(yīng)用開發(fā)、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘的專業(yè)人員以及從事高校信息技術(shù)專業(yè)的教師和高等院校的在讀學(xué)生及相關(guān)領(lǐng)域的廣大科研人員。
你還可能感興趣
我要評(píng)論
|