關于我們
書單推薦
新書推薦
|
大數據處理:從采集到可視化
《大數據處理:從采集到可視化》共分為9章,章數據采集,主要介紹了大數據的概念、類型及其特征,常見的數據采集方法;第2章數據清洗,主要討論數據質量的維度,數據可能存在的質量問題,常見的數據清洗方法;第3章數據ETL,重點介紹了MGO方法;第4章數據存儲,主要介紹了大數據時代的一些主流數據存儲平臺和相關技術;第5章回歸算法,主要介紹了線性回歸、決策樹回歸、隨機森林回歸等,并介紹了其實現(xiàn)的主要步驟以及相應的Python語言實現(xiàn)代碼;第6章分類算法,主要介紹了邏輯回歸二分類和多分類、度提升分類樹等;第7章聚類算法,主要介紹了分割聚類、層次聚類、基于密度的聚類;第8章推薦算法,主要介紹了基于關聯(lián)規(guī)則的推薦、基于內容過濾的推薦等主流方法;第9章數據可視化的關鍵技術,主要介紹了數據的降維、可視化隱喻及相關的交互技術。
你還可能感興趣
我要評論
|