《大數(shù)據(jù)處理:從采集到可視化》共分為9章,章數(shù)據(jù)采集,主要介紹了大數(shù)據(jù)的概念、類型及其特征,常見的數(shù)據(jù)采集方法;第2章數(shù)據(jù)清洗,主要討論數(shù)據(jù)質(zhì)量的維度,數(shù)據(jù)可能存在的質(zhì)量問題,常見的數(shù)據(jù)清洗方法;第3章數(shù)據(jù)ETL,重點介紹了MGO方法;第4章數(shù)據(jù)存儲,主要介紹了大數(shù)據(jù)時代的一些主流數(shù)據(jù)存儲平臺和相關(guān)技術(shù);第5章回歸算法
《大數(shù)據(jù)計算機(jī)基礎(chǔ)(第2版)/大數(shù)據(jù)分析統(tǒng)計應(yīng)用叢書》是中國人民大學(xué)、北京大學(xué)、中國科學(xué)院大學(xué)、中央財經(jīng)大學(xué)、首都經(jīng)濟(jì)貿(mào)易大學(xué)五所高校聯(lián)合培養(yǎng)大數(shù)據(jù)分析碩士實驗班的計算機(jī)基礎(chǔ)教材,目標(biāo)是培養(yǎng)學(xué)生掌握大數(shù)據(jù)分析處理必備的計算機(jī)基礎(chǔ)知識與技能。
l數(shù)據(jù)倉庫、大數(shù)據(jù)、數(shù)據(jù)科學(xué)的簡單介紹。l了解企業(yè)建立數(shù)據(jù)湖的各種途徑。l探索如何構(gòu)建自助服務(wù)模型,以及如何讓分析師便捷訪問數(shù)據(jù)的最佳實踐。l使用不同的方法來構(gòu)建數(shù)據(jù)湖。l了解不同行業(yè)專家實現(xiàn)數(shù)據(jù)湖的方法。
這是一個大數(shù)據(jù)爆發(fā)的時代。面對信息的激流,多元化數(shù)據(jù)的涌現(xiàn),大數(shù)據(jù)已經(jīng)為個人生活、企業(yè)經(jīng)營,甚至國家與社會的發(fā)展都帶來了機(jī)遇和挑戰(zhàn),大數(shù)據(jù)已經(jīng)成為IT信息產(chǎn)業(yè)中最具潛力的藍(lán)海。“大數(shù)據(jù)導(dǎo)論”是一門理論性和實踐性都很強(qiáng)的課程。本書是為高等職業(yè)院校大數(shù)據(jù)技術(shù)與應(yīng)用專業(yè)“大數(shù)據(jù)導(dǎo)論”課程全新設(shè)計改編的,是一本具有豐富實踐特色
近年來,以ApacheSpark為代表的大數(shù)據(jù)處理框架在學(xué)術(shù)界和工業(yè)界得到了廣泛的使用。本書以ApacheSpark框架為核心,總結(jié)了大數(shù)據(jù)處理框架的基礎(chǔ)知識、核心理論、典型的Spark應(yīng)用,以及相關(guān)的性能和可靠性問題。本書分9章,主要包含四部分內(nèi)容。第一部分大數(shù)據(jù)處理框架的基礎(chǔ)知識(第1~2章):介紹大數(shù)據(jù)處理框架的
本書以獨特的方式講解數(shù)據(jù)科學(xué),不僅讓讀者可以輕松學(xué)習(xí)數(shù)據(jù)科學(xué)理論,又可以動手(手算和機(jī)算)進(jìn)行數(shù)據(jù)科學(xué)實戰(zhàn)。本書特色:全彩印刷,圖形、表格、思維導(dǎo)圖豐富;避免深奧的數(shù)學(xué)證明,采用簡單的數(shù)學(xué)說明;用各種學(xué)習(xí)圖將本書內(nèi)容貫穿起來;實戰(zhàn)計算,包含小型數(shù)據(jù)的演算和大型數(shù)據(jù)的實戰(zhàn)程序。 本書共13章,內(nèi)容涵蓋豐富的數(shù)據(jù)科學(xué)
概述了OPCUA;介紹如何操作已經(jīng)建立好的OPCUA信息模型;OPCA的應(yīng)用程序架構(gòu)和系統(tǒng)架構(gòu),*后本書對OPCUA協(xié)議子集進(jìn)行介紹,并對OPCUA與傳統(tǒng)OPC的性能進(jìn)行了對比。對于那些需要進(jìn)一步查詢OPCUA詳情的讀者,本書的附錄給出了參考。
本書由國際數(shù)據(jù)挖掘領(lǐng)域泰斗、UIUC韓家瑋教授和其學(xué)生張超博士(現(xiàn)為佐治亞理工學(xué)院助理教授)合著。介紹了將非結(jié)構(gòu)化文本數(shù)據(jù)轉(zhuǎn)換為多維知識的數(shù)據(jù)挖掘技術(shù),并講解了他們開發(fā)的文本多維數(shù)據(jù)集框架的原理和使用方法。
本書是根據(jù)我國當(dāng)前測控技術(shù)與儀器專業(yè)教學(xué)改革和教材建設(shè)的需要而編寫的一本關(guān)于自動檢測技術(shù)及儀表的教材。全書共分4篇19章,深入、系統(tǒng)地介紹了自動檢測技術(shù)及儀表的相關(guān)理論、原理、技術(shù)及其應(yīng)用等知識。第1篇介紹了檢測技術(shù)及儀表的基本概念及基礎(chǔ)理論,包括檢測技術(shù)及儀表概述、檢測誤差及其處理、信號的描述及其分析、檢測系統(tǒng)及其特
《數(shù)據(jù)清洗》主要介紹數(shù)據(jù)清洗技術(shù)的基本概念與應(yīng)用。全書共有8章,分別講述了數(shù)據(jù)清洗基礎(chǔ)、數(shù)據(jù)清洗方法、文件類型、數(shù)據(jù)采集與抽取、Excel數(shù)據(jù)清洗與轉(zhuǎn)換、ETL數(shù)據(jù)清洗與轉(zhuǎn)換、Python數(shù)據(jù)清洗、R語言數(shù)據(jù)清洗!稊(shù)據(jù)清洗》將理論與實踐操作相結(jié)合,通過大量的案例幫助讀者快速了解和應(yīng)用大數(shù)據(jù)清洗的相關(guān)技術(shù)。針對書中重要