關(guān)于我們
![]() ![]() |
大數(shù)據(jù)采集與預(yù)處理
本書(shū)共分兩部分:第一部分是網(wǎng)絡(luò)數(shù)據(jù)采集與預(yù)處理的基礎(chǔ)理論實(shí)踐,包括任務(wù)1-任務(wù)6,主要講解如何使用Python編寫(xiě)網(wǎng)絡(luò)數(shù)據(jù)采集和預(yù)處理程序,內(nèi)容包括Python環(huán)境搭建,Python基礎(chǔ)語(yǔ)法、語(yǔ)句與函數(shù),網(wǎng)絡(luò)基礎(chǔ)知識(shí),常用網(wǎng)絡(luò)數(shù)據(jù)采集與預(yù)處理庫(kù)和解析庫(kù)、數(shù)據(jù)持久化保存,以及requests庫(kù)、Numpy庫(kù)、Pandas庫(kù)、Selenium技術(shù)、ChromeDriver技術(shù)和Scrapy技術(shù)的應(yīng)用方式。第二部分是網(wǎng)絡(luò)數(shù)據(jù)采集與預(yù)處理的綜合案例,包括任務(wù)7-任務(wù)9,主要講解requests庫(kù)數(shù)據(jù)采集與Echarts可視化技術(shù)相結(jié)合并持久化保存和數(shù)據(jù)預(yù)處理的應(yīng)用案例;Selenium和ChromeDriver技術(shù)相結(jié)合模擬登錄,采集動(dòng)態(tài)和靜態(tài)數(shù)據(jù)并持久化保存和數(shù)據(jù)預(yù)處理的應(yīng)用案例;Hadoop平臺(tái)的Flume日志數(shù)據(jù)采集應(yīng)用案例,充分呈現(xiàn)了大數(shù)據(jù)采集與預(yù)處理主流技術(shù)與可視化技術(shù)的主要功能和特點(diǎn)。
你還可能感興趣
我要評(píng)論
|