用好科技資源 支撐創(chuàng)新發(fā)展
2018年、2019年連續(xù)兩年,組學數(shù)據(jù)庫權(quán)威雜志《核酸研究》對前一年的全球基因組數(shù)據(jù)庫建設進行總結(jié),鮮見地在美英兩個老牌的數(shù)據(jù)庫以外,提到了中國的GSA(組學原始數(shù)據(jù)歸檔庫)。
“美國國立生物技術(shù)信息中心(National Center for Biotechnology Information,簡稱NCBI)和英國歐洲生物信息學中心(European Bioinformatics Institute,簡稱EBI)30多年前已經(jīng)開始建立,我們的GSA是2015年底才上線運營的。”國家基因組科學數(shù)據(jù)中心主任鮑一明介紹,中心的組學數(shù)據(jù)庫之所以能夠得到權(quán)威雜志的認可“點名”,一方面是由于數(shù)據(jù)量增長快,另一方面是數(shù)據(jù)的可用性、標準化方面的工作均與國際接軌。
據(jù)了解,針對我國基因組學數(shù)據(jù)“存管用”的實際需求,解決數(shù)據(jù)孤島等重大問題,科技部、財政部共同支持組建國家基因組科學數(shù)據(jù)中心,依托中國科學院北京基因組研究所,聯(lián)合中國科學院上海營養(yǎng)與健康研究所和中國科學院生物物理研究所共同建設。中心的科學數(shù)據(jù)專業(yè)化團隊,對外提供基因組學數(shù)據(jù)統(tǒng)一存儲、整合挖掘、共享應用的一站式數(shù)據(jù)服務。
順應大健康需求,構(gòu)筑自主數(shù)據(jù)基礎
“之前,中國已成為基因組數(shù)據(jù)產(chǎn)出大國,但未能形成國家級公共數(shù)據(jù)資源。”鮑一明介紹,面向國家大數(shù)據(jù)戰(zhàn)略發(fā)展需求,國家基因組科學數(shù)據(jù)中心圍繞人、動物、植物、微生物基因組數(shù)據(jù),重點開展了數(shù)據(jù)資源及數(shù)據(jù)庫體系建設,并開展了數(shù)據(jù)服務、系統(tǒng)運維、技術(shù)研發(fā)、數(shù)據(jù)挖掘等系列工作。目前,國家基因組科學數(shù)據(jù)中心已擁有自主知識產(chǎn)權(quán)的基因組數(shù)據(jù)匯交、管理與共享系統(tǒng),保障數(shù)據(jù)安全性,支撐并服務于國家重點研發(fā)計劃、國家自然科學基金、中科院先導專項等300余個科研項目的數(shù)據(jù)存儲、管理和共享。
在生命科學研究領域,研究者獲得的基因組學數(shù)據(jù),均需上傳到專業(yè)數(shù)據(jù)庫,方可在雜志上發(fā)表。如今,我國已擁有獲得認可的組學數(shù)據(jù)庫,這將大大提高中國高水平論文被接收過程的便捷性。“中國的學者不需要再將數(shù)據(jù)‘飄洋過海’傳輸?shù)胶M猓梢垣@得更加專業(yè)化的中國式服務。我們的平臺已被多家國際頂級雜志認可,中國學者將數(shù)據(jù)提交到GSA系統(tǒng),其發(fā)表的論文已經(jīng)被多個國際知名期刊所收錄,這包括CNS(《細胞》《自然》《科學》簡稱)、美國科學院院刊等。”鮑一明說,這為“用好科技資源、支撐創(chuàng)新發(fā)展”提供了基礎。
截至2019年8月,國家基因組科學數(shù)據(jù)中心已為國內(nèi)外150多個單位提供免費數(shù)據(jù)存儲服務,累計用戶遞交項目信息超過1200個,用戶提交的測序數(shù)據(jù)量超過1.2PB,收集并存儲的數(shù)據(jù)總量超過4PB,數(shù)據(jù)上傳下載量日均達到1TB。
與國際接軌,不做信息孤島
生物信息的數(shù)據(jù)要海量整合后才會有價值,割裂的數(shù)據(jù)庫只完成了“存”卻難以走向“使用”。例如對人類組學數(shù)據(jù)的整合和挖掘?qū)⒏娴孬@得人類健康問題的解決方案,避免“盲人摸象”。
這正是國家基因組科學數(shù)據(jù)中心成立的初衷和建設的方向。在科學數(shù)據(jù)共享方面,科技部長期致力于打破條塊分割,對相關(guān)部門和行業(yè)長期持續(xù)積累的數(shù)據(jù)資源,以及對國家科技計劃項目的數(shù)據(jù)進行整理、匯交和建庫,同時提高與國際科學數(shù)據(jù)組織的信息交換能力。
2019年,我國國家基因組科學數(shù)據(jù)中心組學數(shù)據(jù)庫被國際著名出版商Elsevier收錄為指定基因數(shù)據(jù)歸檔庫,其權(quán)威性得到國內(nèi)外100余家學術(shù)雜志的認可。國家基因組科學數(shù)據(jù)中心已經(jīng)成為有國際影響力的基因組科學數(shù)據(jù)中心。
目前,國家科技基礎條件平臺中心正在組織國家科學數(shù)據(jù)中心編制五年建設運行實施方案。未來,國家基因組科學數(shù)據(jù)中心將繼續(xù)圍繞基因組科學研究前沿及數(shù)據(jù)的存管用需求,逐步完善中心組織管理架構(gòu)與運行機制,強化隊伍建設,培養(yǎng)復合型數(shù)據(jù)人才;建立數(shù)據(jù)共享、質(zhì)量控制、安全管理等標準與規(guī)范,利用云計算、人工智能、機器學習等先進技術(shù),提升數(shù)據(jù)儲存、管理、挖掘與共享能力;發(fā)展數(shù)據(jù)加密、解密、分級管理、受控訪問等數(shù)據(jù)安全關(guān)鍵技術(shù),建立人類遺傳資源數(shù)據(jù)管理體系,確保國家重要生物資源數(shù)據(jù)本地化存儲、管理與共享利用。
鮑一明表示,希望經(jīng)過5年努力,建成匯聚海量科學數(shù)據(jù)、服務萬家機構(gòu)、引領大數(shù)據(jù)技術(shù)創(chuàng)新的國際一流基因組科學數(shù)據(jù)中心,切實解決我國基因組數(shù)據(jù)存管用難、數(shù)據(jù)流失嚴重、核心基因組科學信息資源先“出口”再“進口”的問題,不斷提升我國在基因組學大數(shù)據(jù)領域的國際話語權(quán)。(張佳星)
關(guān)鍵詞: 科技資源
關(guān)于我們 廣告服務 手機版 投訴文章:435 226 40@qq.com
Copyright (C) 1999-2020 m.yihuigz.com 愛好者日報網(wǎng) 版權(quán)所有 聯(lián)系網(wǎng)站:435 226 40@qq.com