大數據及大數據技術的出現,使得各行各業面臨著新的變革,這些變革或者大大推進了行業的發展,或者逐漸顛覆傳統的運行和發展模式。
傳統的物質世界,因為時空限制,信息是嚴重不對稱的。我們以往很多的商業模式都是基于信息不對稱的物質世界而建立的,很多商業模式都是因為賺取信息不對稱的利潤而生存,如電視臺、報紙、網絡等廣告模式。當世界上的人、事、物都因為產生大量數據而構建起關聯關系,讓人類獲得了無限的信息對稱,一切基于信息不對稱的物質世界而建立的商業模式勢必獲得變革。未來主流的商業模式之一,將是以大數據為基礎的產業互聯網。
醫療行業也是一樣,醫學大數據廣泛涉及人類健康相關的各個領域,如臨床醫療、公共衛生、醫藥研發、醫療市場、健康管理、氣候與環境、精神與心理學、人類遺傳學與組學、社會人口學等等。
一般地講,大數據具有“4V”特征:
1.數據容量-Volume大,常常在PB(1PB=250B)級以上;
2.數據種類-Variety多,常常具有不同的數據類型(結構化、半結構化和非結構化)和數據來源;
3.產生和更新速度-Velocity快(如實時數據流),時效性要求高;
4.科學價值或商業價值-Value大,常常蘊藏著新知識或具有重要預測價值。
人類已進人大數據時代,國際數據公司的研究結果表明,近幾年全球產生的數據量高達數個ZB。基于這樣一個大數據的概念,我們會在各行各業,比如醫療行業,將迎來深度的行業變革,甚至顛覆性的變革。且看下面一個有關醫療行業大數據應用的例子。
醫學大數據顛覆傳統醫療的幾個場景
場景之一:組學大數據精準醫療
人類通過開展組學研究及不同組學間的關聯研究,從環境、生活方式和行為等暴露組學,至個體細胞分子水平上的基因組學、表觀組學、轉錄組學、蛋白組學、代謝組學、宏基因組學,再到個體健康和疾病狀態的表型組學等。利用大數據將各種組學進行綜合及整合,既能為疾病發生、預防和治療提供全面、全新的認識,也有利于開展個體化醫學,即通過系統整合生物醫學與臨床數據,可以更準確地預測個體患病風險和預后,有針對性地實施預防和治療。
場景之二:大數據虛擬藥物研發
快速識別生物標志物和研發藥物。利用某種疾病患者人群的臨床數據和組學數據,可以快速識別有關疾病發生、預后或治療效果的生物標志物。在藥物研發方面,醫學大數據使得人們對病因和疾病發生機制的理解更加深入,從而有助于識別生物靶點和研發藥物。同時,充分利用海量臨床數據和組學數據、已有藥物的研究數據和高通量藥物篩選,能加速藥物篩選過程。
場景之三:生物大數據流行病防治
快速篩檢未知病原和發現可疑致病微生物。通過采集未知病原樣本數據,對病原進行測序,并將未知病原與已知病原的基因序列進行比對,從而判斷其為已知病原或與其最接近的病原類型,據此推測其來源和傳播路線、開展藥物篩選和相應的流行疾病防治。
場景之四:互聯網大數據公衛監測
利用互聯網大數據以及有關專業數據實時開展公共衛生監測。公共衛生監測包括傳染病監測、慢性非傳染性疾病及相關危險因素監測、健康相關監測,如出生缺陷監測、食品安全風險監測等。此外,還可以通過覆蓋全國的患者電子病歷數據庫進行疫情監測,通過監測社交媒體或頻繁檢索的詞條來預測某些傳染病的流行。
場景之五:大數據健康管理
實時開展大數據健康管理,通過可穿戴設備對個體體征數據,如心率、脈率、呼吸頻率、體溫、熱消耗量、血壓、血糖、血氧、體脂含量等數據的實時、連續監測和流數據挖掘、分析,提供實時健康指導與建議,更科學地實施個性化健康管理。
大數據醫學研究
上面列舉了價格醫學大數據變革醫療行業的幾個場景,但這些遠不是醫學大數據應用的全部。大數據還在醫學研究領域發揮變革性的作用,本人在先前的博客中已有相關討論,這里再舉兩個例子。
1.大數據疾病譜研究
了解人群疾病譜的改變,這有助于制定新的疾病防治策略。全球疾病負擔研究是一個應用大數據的實例,該研究應用的數據范圍廣、數據量巨大,近4700臺并行臺式計算機完成了數據準備、數據倉庫建立和數據挖掘分析的自動化和規范化計算,應用大數據研究人群疾病譜。
2.大數據人群隊列研究
以大數據為導向的人群隊列研究逐漸成為醫學研究的熱點。超大規模隊列研究具有大樣本-如數十萬人群,前瞻性-如數十年長期隨訪,多學科-如基礎、臨床、預防、信息等多學科合作,多病種-如對多種疾病進行研究,多因素-如探討多種危險因素,整合性-如監測系統、信息系統、醫保系統的整合,共享性-如生物標本和數據資源的共享,等特點,經過長期隨訪能夠產出大量人群數據,基于大數據的人群隊列研究更具有科學性、可靠性和權威性。
醫學大數據顛覆傳統醫療,不是命題問題,只是時間問題。正如本人對流行的“顛覆”一詞的觀點,“顛覆”是可能的,但不是瞬間的,而是逐漸的。“顛覆”不是否定,“顛覆”是變革,“顛覆”是發展。醫學大數據“顛覆”傳統醫療也是這樣,醫學大數據是變革傳統醫療,醫學大數據是發展傳統醫療。
(來源:36大數據)