• 首頁 > 觀點 > 精準醫學大數據平臺建設的現實與暢想

    精準醫學大數據平臺建設的現實與暢想

    2017-06-01 觀點 Eli

    精準醫學大數據平臺建設的現實與暢想-智醫療網

    精準醫學理念正在全球蔓延,中國也不例外。健康界了解到,我國精準醫學重大專項已于2016年立項,并通過兩次評審落實到60余個項目。

    精準醫學大數據管理和共享技術平臺應運而生

    盡管各方都在追逐精準醫療,但就目前來看,精準醫療依然存在落地之難。

    原因何在?業內的共同認識是,精準醫療的發展離不開大數據,醫療組學大數據和醫學的結合才是精準醫療的核心。而做到這一點,顯然并不容易。

    醫學漸至,剩下的就是精準醫療大數據了。

    一個不爭的事實是,精準醫療大數據應用是個復雜工程,通過平臺建設的方式來促進其應用不失為眼前的策略。因此,2016年立項的國家精準醫學重大專項中,能發現一個名為“精準醫學大數據管理和共享技術平臺”的項目。

    軍事醫學科學院放射與輻射醫學研究所研究員伯曉晨稱,該平臺是國家精準醫學研究重點研發專項的平臺,主要用于精準醫療數據的管理和共享等應用,目前搭建了兩個數據庫:一是疾病數據庫群,一是基礎組學數據庫群。

    平臺怎么建?

    健康界了解到,精準醫學大數據管理和共享技術平臺主要分成5大塊,分別是基礎平臺、疾病數據庫群、基礎組學數據庫群、支撐數據庫群、醫學整合注釋平臺。

    基礎平臺為最基礎的要件,國內生物醫學界幾乎所有知名的組織都參與到該平臺的建設中,主要提供安全可靠高效的PB級大數據存儲計算。

    疾病數據庫群是對接整個醫學專項,提供6個以上的疾病數據庫匯交管理系統,主要涉及到數據整合、關聯、查詢、數據庫建設方面。難點是如何統一模型,劃分疾病數據庫群,并制定相應的規范。

    基礎支撐數據庫群為在建的國家生物大數據中心,即專門抽出中國人群相關的參考數據,形成相當規模的中國人組學數據。難點就是如何把90個病種提交數據,通過其他的基因組的形式注釋出來。“提交上來的是直接測完的結果,并沒有標注基因的異常,需要靠注釋平臺進行注釋。”伯曉晨解釋:“說白了,就是要做大規模的運算。”

    醫學整合注釋平臺則是用于提高醫學的黏度。為什么要提供注釋?伯曉晨解釋,臨床整合數據是沒有參考的,需要通過注釋的方式提供參比的數據。比如,一個突變是稀有的,還是普通的;是針對最早的5個基因組來說的,還是針對千人基因組、萬人基因組來說的,“在5個基因組中屬于稀有的,放到千人基因組中可能就不是了,所以這里面一定要有參比的數據,你用什么數據就決定了整合和注釋這方面的工作量多大。”

    難題待解

    搭建起平臺,并不意味著萬事大吉。

    來自中國科學院院士陳潤生的認識是,要實現精準醫學,必須具備兩個條件,一是獲得組學數據,進行組裝、挖掘,組學測量與大數據分析有機融合才能構建組學大數據的基礎;二是搭建以分子水平信息為代表的基因型數據和以疾病為代表的表觀數據之間的橋梁。他強調,這兩點一定要跟當前的臨床緊密結合。

    面對精準醫療所要處理的海量數據,伯曉晨坦言,目前需要解決的重大問題是超大數據處理和服務能力的基礎平臺架構與技術,此外,如何劃分疾病數據庫群,制定相應的規范需要探索。

    這與陳潤生的看法不謀而合,在他看來,精準醫療的發展離不開以下幾個基礎:

    首先,要奠定組學大數據的基礎。陳潤生曾表示,精準醫療建設首先要獲取海量人群的組學數據,而且所有組學數據必須是大數據,否則將沒有效果。此外,還必須用大數據分析的手段挖掘組學數據中蘊含的跟疾病有關的信息。因此,第一個基礎就是獲取組學數據,并進行大數據處理獲得分子水平和疾病相關的知識。

    其次,建立分子水平上獲取的知識和宏觀臨床疾病之間的橋梁,“也就是建立基因型與表型之間的關聯,這需要發展一系列的醫學信息解讀和生物學信息解讀等方法。”

    “有了這些基礎,才能夠使組學數據能夠應用到診斷的治療當中來,并與影像學、檢驗以及醫生的臨床診斷結合起來。”陳潤生總結。

    負重前行

    低頭邁步的同時,還需要抬頭看目標。

    據了解,精準醫學大數據管理和共享技術平臺設計的技術指標在2020年最終要達到的水平,從基礎平臺存儲來說,需要達到PB級的分布式存儲,一次查詢時間要小于0.5秒,滿足1萬人次以上的并發檢索;在疾病數據庫群方面要建匯交系統、管理平臺、協作平臺,將精準醫學支持的將近90多個群打包成6個以上的群;在基礎組學數據庫、支撐數據庫方面要,則要建立20個以上的跟醫學研究相關的標準組學數據庫的鏡像,總量要達到PB級。

    基于精準醫學大數據管理和共享技術平臺,伯曉晨暢想了精準醫療的未來。在他看來,將來醫療模式可能是一種基于案例的推理,即通過組學智能分析給出某一疾病的規律,多組學的基因組對基因組,轉錄組對轉錄組,然后再對整個基因組學進行劃分和歸類。

    在政策背景和現實需求的雙重推動下,精準醫學的路正在越走越寬。

    心血管疾病的精準醫學路徑

    現階段,對于精準醫學來說,最普適的應用莫過于快速、精準的計算檢驗檢查結果。其中,心血管病檢測成為精準醫學技術的重點應用對象,通過精準醫學技術檢測,幫助患者進行高效、快速、精準的選擇藥物,最大化實現患者的治療希望。

    早在2016年的中國精準心血管病學峰會上,諸多專家就認為醫療領域基于臨床表型組、基因組、蛋白質組、大數據和云計算等技術,將推動心血管疾病精準醫學的研究和應用,為降低心血管疾病的發病率與死亡率、實現心血管疾病的早期預警與干預帶來新契機。

    遵循精準醫學的“精準”原則,心血管疾病防治的行動是,婚前、孕前、植入前、產前和癥狀前、疾病早期和疾病期過程中,實現疾病易感篩查、危險因素干預、遺傳輔助診斷和基于遺傳的診斷,以及針對遺傳突變的治療。

    發表評論

  • 野花视频