高性能分布式SQL查詢引擎Presto可用于對不同的數(shù)據(jù)源執(zhí)行快速的交互式分析。這本實(shí)用指南將帶你學(xué)習(xí)如何對Hive、Cassandra、關(guān)系數(shù)據(jù)庫或?qū)S袛?shù)據(jù)存儲中的數(shù)據(jù)進(jìn)行分析。分析師、軟件工程師、生產(chǎn)工程師可以從中學(xué)習(xí)Presto的管理、使用甚至開發(fā)。初由Facebook開發(fā)的開源軟件Presto如今已被Netfl
本書為北京高等教育精品教材。全書系統(tǒng)全面地介紹了光電檢測技術(shù)的基礎(chǔ)理論、半導(dǎo)體光電檢測器理及特性、半導(dǎo)體光電檢測器件及應(yīng)用、光電信號檢測電路、光電直接檢測系統(tǒng)、光外差檢測系統(tǒng)、光纖傳感檢測技術(shù)、光電信號的數(shù)據(jù)采集與微機(jī)接口、光電檢測技術(shù)的典型應(yīng)用。內(nèi)容編排注重理論與實(shí)際相結(jié)合,一方面注重光電檢測技術(shù)的基本理論和原理的介
隨著互聯(lián)網(wǎng)技術(shù)的普及,數(shù)據(jù)產(chǎn)生的速度加快,數(shù)據(jù)規(guī)模越來越龐大,企業(yè)對數(shù)據(jù)分析師的需求也隨之增加。數(shù)據(jù)分析師需要做好日常的數(shù)據(jù)收集與積累的工作,通過數(shù)據(jù)分析師制定適合企業(yè)的發(fā)展計(jì)劃,幫助企業(yè)在激烈的市場競爭中贏得主動權(quán),實(shí)現(xiàn)跨越發(fā)展。目前世界領(lǐng)先的企業(yè)中,大多已經(jīng)簡歷了數(shù)據(jù)分析部門,知名互聯(lián)網(wǎng)公司如IBM、谷歌等企業(yè)尤其
綜合利用近代各種先進(jìn)技術(shù),采用光電方法對多種光的、非光的物理量進(jìn)行檢測是光電檢測技術(shù)的基本內(nèi)容。全書從基本原理到工程應(yīng)用,系統(tǒng)地介紹了光電檢測技術(shù)的組成,主要組成部分的功能、實(shí)際應(yīng)用和當(dāng)前發(fā)展的情況。主要內(nèi)容包括光電檢測技術(shù)基礎(chǔ)、光源及輻射源、光電探測器及其校正技術(shù)、光學(xué)系統(tǒng)及專用光學(xué)元件、光電信號的變換及檢測技術(shù)、非
本書按照教育部新的職業(yè)教育教學(xué)改革要求,以培養(yǎng)自動生產(chǎn)線的崗位技能為核心進(jìn)行編寫,注重專業(yè)綜合技術(shù)的應(yīng)用和工程實(shí)踐能力的提高,主要內(nèi)容包括:認(rèn)識自動生產(chǎn)線、供料站安裝與調(diào)試、加工站安裝與調(diào)試、裝配站安裝與調(diào)試、分揀站系統(tǒng)安裝與調(diào)試、輸送站系統(tǒng)調(diào)試,以及整機(jī)運(yùn)行等。本書的內(nèi)容體系完整典型、結(jié)構(gòu)清晰、圖文并茂,易于學(xué)生學(xué)習(xí)
大數(shù)據(jù)已深深滲透于人們工作和生活的方方面面。然而,大數(shù)據(jù)從來都不是以“技術(shù)”為其**底色,基于數(shù)據(jù)科學(xué)的創(chuàng)新應(yīng)用,同樣需要其他領(lǐng)域深度融合。本書闡述了培養(yǎng)具有大數(shù)據(jù)素養(yǎng)的綜合型人才所需要的相關(guān)知識儲備。本書不僅介紹大數(shù)據(jù)處理流程中的技術(shù)圖譜,而且更側(cè)重地討論了與數(shù)據(jù)科學(xué)相關(guān)的歷史、哲學(xué)及倫理學(xué),以便于讀者拓展跨領(lǐng)域的數(shù)
本書的編寫目的是向讀者介紹數(shù)據(jù)清洗技術(shù)的基本概念與應(yīng)用。全書共10章,分別為數(shù)據(jù)清洗概述、文件格式、Web數(shù)據(jù)抽取、網(wǎng)絡(luò)爬蟲、Kettle數(shù)據(jù)清洗、數(shù)據(jù)遷移、文本數(shù)據(jù)處理、Python數(shù)據(jù)清洗、DataCleaner數(shù)據(jù)分析與清洗以及數(shù)據(jù)清洗綜合實(shí)訓(xùn)。本書將理論與實(shí)踐操作相結(jié)合,通過大量的案例幫助讀者快速了解和應(yīng)用數(shù)據(jù)
Kettle是一款國外開源的ETL工具,純Java編寫,無須安裝,功能完備,數(shù)據(jù)抽取高效穩(wěn)定。本書介紹并演示如何用Kettle完成Hadoop數(shù)據(jù)倉庫上的ETL過程,所有的描繪場景與實(shí)驗(yàn)環(huán)境都是基于Linux操作系統(tǒng)的虛擬機(jī)。全書共分10章,主要內(nèi)容包括ETL與Kettle的基本概念、Kettle安裝與配置、Kettl
ApacheFlink是一個框架和分布式處理引擎,用于對無界和有界數(shù)據(jù)流進(jìn)行有狀態(tài)的計(jì)算,廣泛應(yīng)用于大數(shù)據(jù)相關(guān)的實(shí)際業(yè)務(wù)場景中。本書是一本從零開始講解Flink的入門教材,學(xué)習(xí)本書需要有Java編程基礎(chǔ)。本書共分10章,內(nèi)容包括Flink開發(fā)環(huán)境搭建、Flink架構(gòu)和原理、時(shí)間和窗口、狀態(tài)管理和容錯機(jī)制、數(shù)據(jù)類型與序列
本書以流體為研究對象,將流動過程原理與流動系統(tǒng)管路和設(shè)備有機(jī)結(jié)合,系統(tǒng)闡述了流程性工業(yè)的特點(diǎn)、流體的主要性質(zhì)、流體靜力學(xué)和動力學(xué)基本方程等基本理論,流體流動現(xiàn)象及流動參量的主要測量方法,流動系統(tǒng)的管路組成、管路流動阻力的計(jì)算及管路特性分析與計(jì)算。重點(diǎn)介紹了以離心泵為代表的流體輸送用泵及其選型方法。同時(shí),結(jié)合工程教育專業(yè)