隨著生物技術(shù)的不斷發(fā)展,高通量測(cè)序技術(shù)得到快速發(fā)展,基因組測(cè)序的成本相對(duì)降低幅度很大,生物數(shù)據(jù)規(guī)模也在隨之增大,生物信息學(xué)也迎來(lái)了大數(shù)據(jù)時(shí)代。云計(jì)算技術(shù)可以給生物信息學(xué)在數(shù)據(jù)分析方面提供計(jì)算資源,從而生物信息大數(shù)據(jù)借助大數(shù)據(jù)的生物信息云迎接更多的新挑戰(zhàn),挖掘數(shù)據(jù)中隱藏的資源。通過(guò)本項(xiàng)目的研究,也可為以后云計(jì)算在其他生物信息學(xué)問(wèn)題中運(yùn)用的研究做出基礎(chǔ)工作。介紹基于云平臺(tái)的機(jī)器學(xué)習(xí)發(fā)展歷程,包括HadoopMapReduce、HDFS、Mahout、Spark及Yarn的主要研究現(xiàn)狀和意義,同時(shí)介紹
本書(shū)以當(dāng)前常用的生物信息學(xué)數(shù)據(jù)庫(kù)為核心,首先概述了生物信息學(xué)數(shù)據(jù)庫(kù)的重要性和應(yīng)用,其次分章介紹了核苷酸序列數(shù)據(jù)庫(kù)、基因組數(shù)據(jù)庫(kù)和基因信息數(shù)據(jù)庫(kù)、基因組突變數(shù)據(jù)庫(kù)、高通量組學(xué)數(shù)據(jù)資源數(shù)據(jù)庫(kù)、生物分子網(wǎng)絡(luò)數(shù)據(jù)庫(kù),這些數(shù)據(jù)庫(kù)為生物學(xué)研究提供了豐富的數(shù)據(jù)資源,為基礎(chǔ)生物學(xué)、疾病生物學(xué)、藥物研發(fā)等領(lǐng)域的研究提供了基礎(chǔ)數(shù)據(jù)支持。
本書(shū)是“計(jì)算機(jī)科學(xué)與技術(shù)手冊(cè)系列”圖書(shū)之一,該系列圖書(shū)內(nèi)容全面,以理論聯(lián)系實(shí)際、能學(xué)到并做到為宗旨,以技術(shù)為核心,以案例為輔助,讀者全面學(xué)習(xí)基礎(chǔ)技術(shù)、代碼編寫(xiě)方法和具體應(yīng)用項(xiàng)目。旨在為想入相應(yīng)領(lǐng)域或者已經(jīng)在該領(lǐng)域深耕多年的技術(shù)人員提供新而全的技術(shù)性內(nèi)容及案例。本書(shū)以Java開(kāi)發(fā)為主要內(nèi)容,分為3篇,分別是:基礎(chǔ)篇、案例篇、應(yīng)用篇,共30章,內(nèi)容由淺入深,循序,使讀者在打好基礎(chǔ)的同時(shí)逐步提升技能。本書(shū)內(nèi)含了Java的基礎(chǔ)知識(shí)和大量的實(shí)例和案例解析,使讀者在學(xué)習(xí)相關(guān)技術(shù)和方法的同時(shí),能夠及時(shí)應(yīng)用和消