面向大數(shù)據(jù)的生物信息云
云計(jì)算是一種通過Internet以服務(wù)的方式提供動(dòng)態(tài)可伸縮的虛擬化的資源的計(jì)算模式。現(xiàn)今,隨著高通量測序技術(shù)的迅猛發(fā)展,生物信息學(xué)進(jìn)入到大數(shù)據(jù)時(shí)代,所引發(fā)的多組學(xué)海量生物數(shù)據(jù)的存儲(chǔ)和分析等問題亟待需要利用云的方式來解決。
近期,中國科學(xué)院北京基因組研究所基因組科學(xué)與信息重點(diǎn)實(shí)驗(yàn)室的“百人計(jì)劃”章張研究員,與沙特阿卜杜拉國王科技大學(xué)(King Abdullah University of Science and Technology)、北京理工大學(xué)、IBM中國系統(tǒng)與科技中心開展合作研究,在Biology Direct雜志上發(fā)表了題為Bioinformatics clouds for big data manipulation的學(xué)術(shù)論文。文中分析了現(xiàn)有生物信息學(xué)領(lǐng)域的云計(jì)算服務(wù)(簡稱:生物信息云),根據(jù)其服務(wù)特點(diǎn)提出分類方法:數(shù)據(jù)即服務(wù)(DaaS,Data as a Service)、軟件即服務(wù)(SaaS,Software as a Service)、平臺(tái)即服務(wù)(PaaS,Platform as a Service)以及基礎(chǔ)設(shè)施即服務(wù)(IaaS,Infrastructure as a Service)。
生物信息云從四個(gè)方面提供了海量生物數(shù)據(jù)的儲(chǔ)存、獲取、分析等相關(guān)需求的服務(wù)。同時(shí),文中對云計(jì)算在生物信息學(xué)的應(yīng)用進(jìn)行了展望和討論,提出并分析了以下幾個(gè)亟需解決問題,即生物信息云應(yīng)實(shí)現(xiàn)數(shù)據(jù)和軟件的云儲(chǔ)存,結(jié)合的高速傳輸、P2P、數(shù)據(jù)壓縮等大數(shù)據(jù)的傳輸,開發(fā)基于云的輕量型編程環(huán)境,以及建立開放的生物信息學(xué)云平臺(tái)。