本書共4個項目15個任務(wù),項目由易到難、從單一到綜合,各個項目間既有機(jī)聯(lián)系又相互獨立,授課教師可以根據(jù)所教學(xué)生的學(xué)情分析結(jié)果選擇某一個項目單獨教學(xué)并進(jìn)行任務(wù)實施。4個項目分別是:安裝環(huán)境準(zhǔn)備、Hadoop集群完全分布式部署、Hadoop生態(tài)系統(tǒng)常用組件部署、HadoopHA集群部署。每個項目的任務(wù)都包含了任務(wù)目標(biāo)、知識
在諸如上市公司財務(wù)風(fēng)險預(yù)測等多源異構(gòu)數(shù)據(jù)場景中,多智能體系統(tǒng)憑借其獨特的群智決策優(yōu)勢受到高度關(guān)注,具有廣闊的應(yīng)用前景。與此同時,由于人工智能黑箱現(xiàn)象的普遍存在,人們在理解、管理和信任智能系統(tǒng)過程中面臨十分嚴(yán)峻的問題。因此,如何增強(qiáng)多智能體系統(tǒng)決策支持的可解釋性成為十分重要而富有挑戰(zhàn)性的前沿課題之一。本書結(jié)合認(rèn)知心理學(xué)中
本書系統(tǒng)介紹了MATLABR2022a仿真軟件在自動控制領(lǐng)域的功能亮點和MATLAB編程基礎(chǔ),由淺入深地介紹了基于Simulink模塊編程的仿真系統(tǒng)搭建與分析方法。本書第1章介紹了MATLAB基礎(chǔ)知識;第2章闡述了經(jīng)典控制理論中的數(shù)學(xué)建模、時域分析、根軌跡分析、頻域分析、系統(tǒng)校正與設(shè)計和非線性控制系統(tǒng)分析等關(guān)鍵理論與M
實體識別在數(shù)據(jù)質(zhì)量管理中起著重要作用,它是數(shù)據(jù)質(zhì)量管理的重要研究方向。實體識別的目的是識別出數(shù)據(jù)集中描述同一真實世界實體的元組。實體識別的結(jié)果可以在數(shù)據(jù)質(zhì)量管理的其他階段(如數(shù)據(jù)清洗階段和數(shù)據(jù)質(zhì)量評估階段)得到廣泛應(yīng)用。在一個或多個數(shù)據(jù)庫中,同一個現(xiàn)實世界實體可能具有多種描述方式,這一問題在各種應(yīng)用領(lǐng)域的信息系統(tǒng)中普遍
本書在R語言和Python的基礎(chǔ)上開發(fā)了基于云計算的可視化云平臺。全書內(nèi)容包括:大數(shù)據(jù)分析基礎(chǔ)、簡單數(shù)據(jù)挖掘、基本統(tǒng)計方法、統(tǒng)計分析模型、時間序列預(yù)測技術(shù)、多元決策分析方法、大數(shù)據(jù)分析進(jìn)階七章。
"數(shù)據(jù)科學(xué)項目日益增多,每個項目在提出原型到生產(chǎn)的過程中都需要可靠的基礎(chǔ)設(shè)施。使用《Effective數(shù)據(jù)科學(xué)基礎(chǔ)設(shè)施》介紹的一些新技術(shù)和新工具,你將能建立一個適用于各類組織(無論是初創(chuàng)企業(yè)還是大型企業(yè))的基礎(chǔ)設(shè)施堆棧!禘ffective數(shù)據(jù)科學(xué)基礎(chǔ)設(shè)施》可幫助你建立數(shù)據(jù)流程和項目工作流,為你開發(fā)項目帶來強(qiáng)大動力!
從什么是數(shù)據(jù),數(shù)據(jù)與優(yōu)化的關(guān)系入手,以經(jīng)典的傳統(tǒng)數(shù)據(jù)分析方法和最新的深度學(xué)習(xí)算法為例,系統(tǒng)介紹了數(shù)據(jù)分析的算法設(shè)計思想及實現(xiàn)方法。內(nèi)容涉及了數(shù)據(jù)的可視化、特征選擇與降維、神經(jīng)網(wǎng)絡(luò)基本原理、無監(jiān)督學(xué)習(xí)、有監(jiān)督學(xué)習(xí)、深度學(xué)習(xí)的魯棒性等,全書提供了豐富的實例以及完整的可實現(xiàn)的Pyth從什么是數(shù)據(jù),數(shù)據(jù)與優(yōu)化的關(guān)系入手,以經(jīng)典
本書以Hadoop3.3.0為核心,涵蓋Hadoop生態(tài)系統(tǒng)的常用組件,主要介紹各組件的架構(gòu)原理、Shell命令、常用API及編程等,并配有較多例題。全書共7章,內(nèi)容包含Hadoop概述、Hadoop偽分布式安裝、Hadoop分布式文件系統(tǒng)HDFS、分布式計算框架MapReduce、分布式數(shù)據(jù)庫HBase、數(shù)據(jù)倉庫Hi
本書由校企“雙元”合作開發(fā),以企業(yè)真實項目的實施流程為主線,通過“電商平臺用戶行為數(shù)據(jù)分析”項目實戰(zhàn),貫穿Hadoop大數(shù)據(jù)核心技術(shù),包括項目需求、大數(shù)據(jù)平臺部署、數(shù)據(jù)采集、離線數(shù)據(jù)倉庫設(shè)計與開發(fā)和項目數(shù)據(jù)可視化展示。本書內(nèi)容主要涉及VMware、Xshell、IDEA等軟件的安裝配置;Hadoop分布式集群環(huán)境搭建;
《大數(shù)據(jù)應(yīng)用基礎(chǔ)教程》旨在培養(yǎng)大學(xué)低年級本科生的大數(shù)據(jù)應(yīng)用能力,使其初步建立數(shù)據(jù)思維,以滿足“新工科”“新醫(yī)科”“新農(nóng)科”“新文科”建設(shè)背景下高校培養(yǎng)學(xué)生數(shù)據(jù)素養(yǎng)能力的新要求。全書共3篇;A(chǔ)篇(第1、2章)主要內(nèi)容為大數(shù)據(jù)概述、Python及常用類庫;數(shù)據(jù)分析篇(第3~7章)重點闡述數(shù)據(jù)獲取、存儲、預(yù)處理、可視化和分