隨著生物技術(shù)的不斷發(fā)展,高通量測序技術(shù)得到快速發(fā)展,基因組測序的成本相對降低幅度很大,生物數(shù)據(jù)規(guī)模也在隨之增大,生物信息學(xué)也迎來了大數(shù)據(jù)時代。云計算技術(shù)可以給生物信息學(xué)在數(shù)據(jù)分析方面提供計算資源,從而生物信息大數(shù)據(jù)借助大數(shù)據(jù)的生物信息云迎接更多的新挑戰(zhàn),挖掘數(shù)據(jù)中隱藏的資源。通過本項目的研究,也可為以后云計算在其他生物信息學(xué)問題中運用的研究做出基礎(chǔ)工作。介紹基于云平臺的機(jī)器學(xué)習(xí)發(fā)展歷程,包括HadoopMapReduce、HDFS、Mahout、Spark及Yarn的主要研究現(xiàn)狀和意義,同時介紹
本書以當(dāng)前常用的生物信息學(xué)數(shù)據(jù)庫為核心,首先概述了生物信息學(xué)數(shù)據(jù)庫的重要性和應(yīng)用,其次分章介紹了核苷酸序列數(shù)據(jù)庫、基因組數(shù)據(jù)庫和基因信息數(shù)據(jù)庫、基因組突變數(shù)據(jù)庫、高通量組學(xué)數(shù)據(jù)資源數(shù)據(jù)庫、生物分子網(wǎng)絡(luò)數(shù)據(jù)庫,這些數(shù)據(jù)庫為生物學(xué)研究提供了豐富的數(shù)據(jù)資源,為基礎(chǔ)生物學(xué)、疾病生物學(xué)、藥物研發(fā)等領(lǐng)域的研究提供了基礎(chǔ)數(shù)據(jù)支持。
本書是“計算機(jī)科學(xué)與技術(shù)手冊系列”圖書之一,該系列圖書內(nèi)容全面,以理論聯(lián)系實際、能學(xué)到并做到為宗旨,以技術(shù)為核心,以案例為輔助,讀者全面學(xué)習(xí)基礎(chǔ)技術(shù)、代碼編寫方法和具體應(yīng)用項目。旨在為想入相應(yīng)領(lǐng)域或者已經(jīng)在該領(lǐng)域深耕多年的技術(shù)人員提供新而全的技術(shù)性內(nèi)容及案例。本書以Java開發(fā)為主要內(nèi)容,分為3篇,分別是:基礎(chǔ)篇、案例篇、應(yīng)用篇,共30章,內(nèi)容由淺入深,循序,使讀者在打好基礎(chǔ)的同時逐步提升技能。本書內(nèi)含了Java的基礎(chǔ)知識和大量的實例和案例解析,使讀者在學(xué)習(xí)相關(guān)技術(shù)和方法的同時,能夠及時應(yīng)用和消