"隨著大數(shù)據(jù)、人工智能的進(jìn)一步發(fā)展,特別是開源數(shù)據(jù)的不斷積累,使得如何快速將開源數(shù)據(jù)轉(zhuǎn)換為可理解的態(tài)勢,形成可預(yù)判的決策,并產(chǎn)生精準(zhǔn)的行動已成為數(shù)據(jù)智能化運(yùn)用需要解決的重要問題。本書引入OODA決策循環(huán)理論,以觀察(Observe),判斷(Orient),決策(Decide)和行動(Act)循環(huán)理論來貫穿整個(gè)開源數(shù)據(jù)分
本書主要介紹數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)的入門知識,并在此基礎(chǔ)上介紹大數(shù)據(jù)分析教學(xué)平臺BDAP的功能和實(shí)驗(yàn)過程。本書首先以大數(shù)據(jù)時(shí)代的大背景介紹數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)興起的,本書接著介紹大數(shù)據(jù)的概念、特征及相關(guān)技術(shù)。然后介紹了一個(gè)大數(shù)據(jù)分析教學(xué)平臺BDAP,平臺的功能、特點(diǎn)及使用方法,重點(diǎn)介紹教學(xué)實(shí)用案例。本書及配套平臺可
《數(shù)據(jù)挖掘方法與應(yīng)用》對數(shù)據(jù)挖掘中常用的建模算法進(jìn)行系統(tǒng)介紹,內(nèi)容涵蓋了數(shù)據(jù)預(yù)處理、關(guān)聯(lián)規(guī)則挖掘、聚類分析、決策樹及組合算法、貝葉斯分類、支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)等。在闡述每種算法基本理論的基礎(chǔ)上,同時(shí)給出基于R軟件的應(yīng)用方法。這種理論與應(yīng)用相結(jié)合的方式為讀者理解和運(yùn)用這些方法提供了堅(jiān)實(shí)的基礎(chǔ),有助于讀者
本書主旨是指導(dǎo)組織中數(shù)據(jù)治理相關(guān)角色在大數(shù)據(jù)環(huán)境下,如何對數(shù)據(jù)資產(chǎn)進(jìn)行有效治理,更好地為組織提供數(shù)據(jù)服務(wù)。全書共10章,主要包括大數(shù)據(jù)治理與服務(wù)概述、大數(shù)據(jù)治理與服務(wù)總體框架、大數(shù)據(jù)架構(gòu)治理、元數(shù)據(jù)治理、主數(shù)據(jù)治理、文檔和內(nèi)容治理、大數(shù)據(jù)質(zhì)量治理、大數(shù)據(jù)安全治理、大數(shù)據(jù)治理能力成熟度評估模型和大數(shù)據(jù)服務(wù)等內(nèi)容。本書可作
《創(chuàng)新方法新系統(tǒng)》系統(tǒng)介紹了創(chuàng)新方法新系統(tǒng)理論體系構(gòu)建的一般路徑和重要實(shí)踐意義。首先,《創(chuàng)新方法新系統(tǒng)》創(chuàng)見性闡釋了TRIZ理論、群智理論和知識圖譜技術(shù)作為創(chuàng)新方法新系統(tǒng)構(gòu)建過程中的重要理論來源作用,并嘗試就其如何為復(fù)雜創(chuàng)新場景中的理論融合與創(chuàng)新進(jìn)行了深入探索;其次,《創(chuàng)新方法新系統(tǒng)》就如何從理論和實(shí)踐層面構(gòu)建創(chuàng)新方法
本書介紹基于Python語言的網(wǎng)絡(luò)數(shù)據(jù)采集技術(shù)的相關(guān)知識,并為采集網(wǎng)絡(luò)中的各種數(shù)據(jù)類型提供全面指導(dǎo)。第1章重點(diǎn)介紹Scrapy框架及配置方法;第2~6章重點(diǎn)介紹網(wǎng)絡(luò)數(shù)據(jù)采集的基本原理,包括如何利用Python從網(wǎng)絡(luò)服務(wù)器請求信息,如何對服務(wù)器的響應(yīng)進(jìn)行基本處理,以及如何通過自動化的手段與網(wǎng)站進(jìn)行交互;第7、8章介紹登錄
本書為大數(shù)據(jù)時(shí)代下的產(chǎn)物,由淺入深地介紹大數(shù)據(jù)及其相關(guān)知識,在大數(shù)據(jù)的背景下著重介紹ETL數(shù)據(jù)處理技術(shù),同時(shí)引入數(shù)據(jù)清洗的知識,理論與實(shí)際相結(jié)合,突出所長。在理論上,本書突出重點(diǎn)與難點(diǎn),較為系統(tǒng)地介紹大數(shù)據(jù)的各項(xiàng)基本技術(shù)。在實(shí)踐操作上,本書貼近生活,切實(shí)理解,緊跟實(shí)驗(yàn)進(jìn)行,并從中萃取精華。同時(shí)本書還介紹ETL技術(shù)的主流
本書以常見的數(shù)據(jù)分析與大數(shù)據(jù)應(yīng)用方法為主線,按照數(shù)據(jù)采集、數(shù)據(jù)存儲與管理、數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析與挖掘的邏輯關(guān)系分析大數(shù)據(jù)時(shí)代應(yīng)如何采用量化方法分析經(jīng)濟(jì)問題。本書在定性分析的基礎(chǔ)上,采用大量的實(shí)例和軟件操作插圖來直觀地解釋大數(shù)據(jù)分析方法的原理和應(yīng)用,為讀者提供“一站式”服務(wù)。同時(shí),通過對線性回歸、邏輯回歸等計(jì)量方法,主成
本書分為5篇,包括11章和3個(gè)附錄。大數(shù)據(jù)基礎(chǔ)篇包括第1章(緒論);大數(shù)據(jù)存儲篇包括第2~3章(HDFS分布式文件系統(tǒng)、NoSQL及其HBase分布式數(shù)據(jù)庫系統(tǒng));大數(shù)據(jù)計(jì)算篇包括第4~7章(MapReduce分布式計(jì)算、大數(shù)據(jù)的Spark內(nèi)存計(jì)算、大數(shù)據(jù)的流計(jì)算、大數(shù)據(jù)的圖計(jì)算);大數(shù)據(jù)管理、查詢分析及可視篇包括第8
本書主要根據(jù)作者近幾年在清華大學(xué)面向研究生和本科生開設(shè)的數(shù)據(jù)挖掘:方法與應(yīng)用課程的教學(xué)實(shí)踐與積累,參考近幾年國外著名大學(xué)相關(guān)課程的教學(xué)體系編寫而成。本書系統(tǒng)地介紹數(shù)據(jù)挖掘的基本概念和基本原理方法;結(jié)合一些典型的應(yīng)用實(shí)例展示用數(shù)據(jù)挖掘的思維方法求解問題的一般性模式與思路。本書可作為有一定數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)庫和程序設(shè)計(jì)基礎(chǔ)的研