本書對大數(shù)據(jù)挖掘與應(yīng)用的基本算法進(jìn)行了系統(tǒng)的介紹,每種算法不僅包括對算法基本原理的介紹,而且配有大量的例題以及基于阿里云大數(shù)據(jù)平臺(數(shù)加平臺)的演示,這種理論與實踐相結(jié)合的方式極大地方便了讀者對抽象的數(shù)據(jù)挖掘算法的理解和掌握。本書共11章,內(nèi)容覆蓋了數(shù)據(jù)預(yù)處理、分類算法、聚類算法及常見的數(shù)據(jù)挖掘應(yīng)用,具體章節(jié)包括大數(shù)據(jù)
Centreon是一款分布式開源監(jiān)控平臺,易于安裝、管理,可支持大規(guī)模的網(wǎng)絡(luò)監(jiān)控。本書基于作者實踐經(jīng)驗講述如何使用Centreon。全書共15章,大致可分為4部分:第1章和第2章為基礎(chǔ)部分,主要介紹分布式監(jiān)控平臺Centreon的主要特征、功能;第3~5章介紹系統(tǒng)部署,用ISO鏡像文件部署Centreon及在CentO
本書采用“問題描述+解決方案”模式,通過500個案例介紹了使用Pandas進(jìn)行數(shù)據(jù)分析和數(shù)據(jù)處理的技術(shù)亮點。全書共分為8章,主要案例包括:讀寫CSV、Excel、JSON、HTML等格式的數(shù)據(jù);根據(jù)行標(biāo)簽、列名和行列數(shù)字索引篩選和修改數(shù)據(jù),使用各種函數(shù)根據(jù)數(shù)據(jù)大小、日期范圍、正則表達(dá)式、lambda表達(dá)式、文本類型等多
本書系統(tǒng)介紹Spark大數(shù)據(jù)處理框架。全書共8章,內(nèi)容包括大數(shù)據(jù)技術(shù)概述、Spark大數(shù)據(jù)處理框架、SparkRDD編程、SparkSQL結(jié)構(gòu)化數(shù)據(jù)處理、HBase分布式數(shù)據(jù)庫、SparkStreaming流計算、SparkMLlib機(jī)器學(xué)習(xí)、數(shù)據(jù)可視化。本書可作為高等院校計算機(jī)科學(xué)與技術(shù)、信息管理與信息系統(tǒng)、軟件工程
本書從系統(tǒng)的角度,成體系地研究動態(tài)數(shù)據(jù)驅(qū)動原理與方法。以數(shù)據(jù)驅(qū)動為根本出發(fā)點,揭示了復(fù)雜系統(tǒng)的設(shè)計、運(yùn)行、控制與優(yōu)化規(guī)律,從信號感知、結(jié)構(gòu)感知、環(huán)境感知、情景感知、語境感知、能量感知、過程感知、網(wǎng)絡(luò)感知、系統(tǒng)感知等不同維度,介紹了主流的理論與方法,提供了研究復(fù)雜系統(tǒng)問題的新思路、新方法。
本書系統(tǒng)介紹了大數(shù)據(jù)領(lǐng)域的相關(guān)知識,幫助讀者快速了解大數(shù)據(jù)的相關(guān)理論知識和技術(shù)。全書一共包含十個章節(jié),分別為大數(shù)據(jù)概述、大數(shù)據(jù)與其他新型技術(shù)、大數(shù)據(jù)技術(shù)基礎(chǔ)、大數(shù)據(jù)預(yù)采集、大數(shù)據(jù)預(yù)處理、大數(shù)據(jù)存儲、大數(shù)據(jù)處理框架、大數(shù)據(jù)挖掘、大數(shù)據(jù)可視化、大數(shù)據(jù)安全。全書全面系統(tǒng)地對大數(shù)據(jù)的相關(guān)知識進(jìn)行了講述,能夠幫助讀者后續(xù)更好地學(xué)
本專著主要介紹基于數(shù)據(jù)驅(qū)動的個性化需求預(yù)測理論與方法。根據(jù)交互場景的特點,分別從基本交互、交互廣度、交互深度和交互多樣性四個角度介紹最新個性化需求預(yù)測理論與方法。在基本交互場景中,主要研究了基于用戶和產(chǎn)品的交互的個性化需求預(yù)測;在交互廣度方面,主要研究了融合用戶與好友關(guān)系交互以及融合用戶與群組交互場景的個性化需求預(yù)測;
數(shù)據(jù)是組織的重要資產(chǎn),做好數(shù)據(jù)管理是盤活數(shù)據(jù)資源,釋放數(shù)據(jù)價值的有效手段。本書以數(shù)據(jù)管理為主題,分為背景篇、標(biāo)準(zhǔn)篇、貫標(biāo)篇、評估篇和政策篇五個篇章,首先梳理了數(shù)據(jù)管理的概念、背景和發(fā)展歷程,為讀者建立對數(shù)據(jù)管理的總體認(rèn)識;其次詳細(xì)解讀國家標(biāo)準(zhǔn)——數(shù)據(jù)管理能力成熟度評估模型(以下簡稱DCMM),幫助讀者深入理解DCMM標(biāo)
本書是在大數(shù)據(jù)時代已經(jīng)到來之際,在商業(yè)、經(jīng)濟(jì)及其他領(lǐng)域中,在基于數(shù)據(jù)和分析去發(fā)現(xiàn)問題并做出科學(xué)、客觀的決策越來越重要的背景下,為了滿足日益增長的數(shù)據(jù)分析人才需求,特開設(shè)基于Python的《數(shù)據(jù)挖掘與數(shù)據(jù)分析》課程。通過本課程的學(xué)習(xí),使學(xué)生學(xué)會使用Python進(jìn)行科學(xué)計算、可視化繪圖、數(shù)據(jù)處理,分析與建模,并詳細(xì)拆解學(xué)習(xí)
在大數(shù)據(jù)時代,我們并不缺少數(shù)據(jù),缺少的是利用數(shù)據(jù)分析的思維和工具去解決實際問題的能力。數(shù)據(jù)化分析是運(yùn)用恰當(dāng)?shù)姆椒ê凸ぞ�,對�?shù)據(jù)進(jìn)行科學(xué)、有效的分析,從而提出有理有據(jù)、具有可操作性的建議,以解決現(xiàn)實中的難題。本書主要介紹了數(shù)據(jù)分析的9種思維、7種工具、學(xué)習(xí)方法、基本方法、展現(xiàn)方法、制作數(shù)據(jù)分析報告的方法,以及數(shù)據(jù)分析的思