《實戰(zhàn)大數(shù)據(jù)(Hadoop+Spark+Flink)——從平臺構(gòu)建到交互式數(shù)據(jù)分析(離線/實時)》詳細介紹了大數(shù)據(jù)工程師在實際工作中應(yīng)該熟練掌握的大數(shù)據(jù)技術(shù)。全書共8章,分別是大數(shù)據(jù)技術(shù)概述、搭建IDEA開發(fā)環(huán)境及Linux虛擬機、基于Hadoop構(gòu)建大數(shù)據(jù)平臺、基于HBase和Kafka構(gòu)建海量數(shù)據(jù)存儲與交換系統(tǒng)、用
企業(yè)數(shù)字化轉(zhuǎn)型中Z適合的數(shù)據(jù)資產(chǎn)組織方式是什么樣的? 為什么越來越多的企業(yè)在討論標(biāo)簽化和標(biāo)簽體系? 數(shù)瀾?yīng)殑?chuàng)的標(biāo)簽類目體系方法論有何獨到之處? 數(shù)據(jù)資產(chǎn)化是企業(yè)數(shù)字化轉(zhuǎn)型的必經(jīng)之路,也是數(shù)據(jù)中臺的重要組成部分。 標(biāo)簽類目體系是數(shù)據(jù)中臺理念落地的核心組成部分,是實現(xiàn)數(shù)據(jù)資產(chǎn)可復(fù)用、柔性組合使用、降低數(shù)據(jù)應(yīng)用試錯門檻
本書圍繞新基建的云計算、大數(shù)據(jù)及人工智能進行介紹,分為以下五個部分。第一部分介紹大數(shù)據(jù)的概念與特點,以及典型的產(chǎn)業(yè)應(yīng)用場景;第二部分介紹目前云計算中的一個重要的研究與應(yīng)用領(lǐng)域—容器云,包含應(yīng)用容器引擎Docker與容器編排工具Kubernetes;第三部分是大數(shù)據(jù)分析的基礎(chǔ),也是大數(shù)據(jù)分析技術(shù)的重點,包含Hadoop、
本書是一本綜合性和工程性強的專業(yè)課教材,共分7章。本書以控制理論、計算機技術(shù)、通信技術(shù)、關(guān)鍵歷史事件為出發(fā)點,系統(tǒng)講述了過程控制系統(tǒng)的發(fā)展歷程及趨勢;詳細梳理了可編輯邏輯控制器、集散控制系統(tǒng)、現(xiàn)場總線控制系統(tǒng)等典型過程控制系統(tǒng)的產(chǎn)生、發(fā)展、未來,關(guān)鍵技術(shù)及典型應(yīng)用;以過程監(jiān)控系統(tǒng)為載體,分析實際控制系統(tǒng)的架構(gòu)及關(guān)鍵技術(shù)
本書通俗地講解數(shù)據(jù)科學(xué)與并行計算的基本概念、方法和原理,系統(tǒng)地介紹基于典型大數(shù)據(jù)場景的并行計算解決思路,同時涵蓋常用的數(shù)據(jù)并行計算工具的操作實踐,使讀者知其然更知其所以然。本書的特色在于:注重對大數(shù)據(jù)科學(xué)方法核心應(yīng)用的講解,突出以并行計算思維解決大數(shù)據(jù)場景問題的案例教學(xué);诘湫痛髷(shù)據(jù)場景案例數(shù)據(jù)集,循序漸進地引導(dǎo)讀者
非線性系統(tǒng)的控制問題近年來受到越來越廣泛的重視,也極大地推動了非線性控制理論及其應(yīng)用的進展。本書從系統(tǒng)分析和設(shè)計角度,系統(tǒng)地介紹了非線性控制系統(tǒng)的基本理論、基本方法和應(yīng)用技術(shù),是作者多年來一直從事非線性控制系統(tǒng)教學(xué)和科研工作的結(jié)晶,同時融入了國內(nèi)外同行近年來所取得的新成果。全書分為三大部分。第一部分(第1章~第4章)介
本書以任務(wù)為載體,以實施過程為主線,將知識點穿插到任務(wù)實施過程中,知識體系的構(gòu)建循序漸進、由易到難、由淺入深,符合普遍認知規(guī)律。本書以Hadoop大數(shù)據(jù)平臺為重點,主要內(nèi)容包括預(yù)備知識、準(zhǔn)備Hadoop環(huán)境、搭建Hadoop大數(shù)據(jù)平臺、使用Java語言編寫MapReduce程序、使用Python語言編寫MapReduc
本書先簡單介紹了Spark和SparkMLlib,然后介紹標(biāo)準(zhǔn)SparkMLlib庫之外的更強大的第三方機器學(xué)習(xí)算法和庫。通過閱讀本書,你將能夠通過幾十個實際的例子和深刻的解釋,將所學(xué)到的知識應(yīng)用到真實世界的用例。
本書由“數(shù)據(jù)倉庫之父”Inmon和“DataVault之父”Linstedt領(lǐng)銜撰寫,帶領(lǐng)讀者從宏觀視角了解數(shù)據(jù)架構(gòu)的基本概念和原則,是數(shù)據(jù)科學(xué)家、分析師和管理者在入門階段的必備參考讀物。本書創(chuàng)新性地提出終端狀態(tài)架構(gòu)的概念,新增了關(guān)于可視化和大數(shù)據(jù)的章節(jié),以及文本管理和分析等來自不同行業(yè)的實例。通過閱讀本書,讀者將通曉
本書主要分析Hadoop3.2.0的新特性和新功能,共5章。首先簡單介紹Hadoop,讓剛接觸Hadoop的讀者對它有個基本了解;接著介紹目前使用比較多的分布式文件系統(tǒng)HDFS,內(nèi)容涉及NameNode的原理、HA、HDFSFederation和HDFS3.0中新增的特性;然后從應(yīng)用管理和資源調(diào)度這兩個方面介紹一個通用