何謂大數據?顧名思義,就是體量特別大且數據類型復雜多樣的數據集,其特征是數量大、類別多、真實性高、速度快,因而難以用傳統數據庫工具對其內容進行抓取、管理和處理。如今,隨著現代科技的發展,人們對數據處理的能力也在明顯提高,以往一團迷霧一樣的大數據成為新的科研富礦,從中人們可以科學地存儲、研發、利用、分析數據,并得到精確的結果。
大數據讓科研更具針對性
北京市神經外科研究所 張亞卓
我們正處在一個醫學信息爆炸的時代。據統計,醫學信息資源占據約30%以上互聯網信息資源,醫學文獻的數量正以驚人的速度增長。全球醫藥類期刊近3萬種,每年發表論文200多萬篇并且以每年7%速度遞增。臨床醫生平均每天必須閱讀大量的專業文獻,才可能跟上現代醫學發展的速度。2012年,美國政府發布了《大數據研究和發展倡議》,旨在利用大量復雜數據集合獲取知識和提升洞見能力,投入金額高達2億美元。與此同時,醫學科技的發展也離不開大數據。在科研的過程中,大數據的利用、開發和整理,可以顛覆我們以往很多研究結果,為我們帶來意想不到的效益。
大數據時代下的醫學科研,應該具有三個主要特點。第一,臨床醫學資源發掘、收集、整理和利用(標準化、科學化)。第二,大樣本、多中心的臨床研究(病因、診斷、治療及藥物開發)。第三,依托臨床信息的生物醫學資源的整理、利用及研究(基因、蛋白及代謝)。那么,大數據時代下的腫瘤研究的特征就更具針對性了。主要有臨床信息、腫瘤生物學特性、基因蛋白等數據庫,個體基因測序和數據快速處理,分子標記、藥物靶標的鑒定和特征描述,新型藥物的設計。
大數據時代下的傳染病控制
中國疾病預防控制中心傳染病預防控制所生物信息室負責人 陳 晨
公共衛生安全是全民討論的熱點和關心的話題,例如2011年的德國大腸桿菌O104事件,引起全世界人的關注。在細菌性傳染病領域,新發、突發細菌性傳染病尤為引人注目,不斷引起嚴重的公共衛生威脅;同時,既往曾經被控制的傳染病因為社會經濟因素的變化,又造成新的暴發流行。這些暴發流行不僅造成了大量的經濟資源的浪費,更是造成了人們心里的恐慌。
傳統的細菌性傳染病的防控在微生物學、分子生物學的檢測與分析上,已形成了一系列的檢測技術手段。近些年,生物基因組學和網絡大數據分析技術的獲得突破性發展。基因組學在傳染病的篩查確認、疫情傳染來源的追蹤、以及病原變異等方面,提供了新的強有力的技術手段,而大數據分析對于傳染病的預測、疫情傳染來源的追蹤提供了新的手段。這兩項新的技術的共同點都是:大數據。
有關大數據分析中的核心數據庫的建立、標準大數據分析流程和網絡數據挖掘三個方面,陳晨主任會在生物醫療大數據會議中和大家共同探討。
我理想中的醫療大數據
北京大學腫瘤醫院肝膽外科 錢紅綱
我國的醫療信息化建設用了十年,經歷了數字化、35212及36312工程等不同階段。大數據從提出到現在也有4年多了。很多人更是看了麥肯錫2011年報告中一年3000億美元的附加值而躍躍欲試。然而,醫療大數據在醫生眼中是怎樣的呢?
目前,只有大醫生或大醫院才關注大數據,而臨床工作的繁重讓絕大多數一線醫生無暇顧及身邊默默發生的變化,他們更需要的是提高效率、簡單易行的臨床輔助工具,而不是在原有基礎上再增加額外的負擔。因此,如何讓作為醫療服務主體的醫生接受大數據理念,心甘情愿地運用大數據是讓其從浮云上落地的前提。大數據的收集者需要解決數據錄入和訪問的快捷問題,才能得到作為使用者之一的醫生的擁護。另外,多年來各個醫院開發了各自的病歷系統,如何兼容各個數據接口也是一大難題。當很多統計數據來源于患者時,他們能否提供準確的醫療信息?大數據開發過程中,醫學工作者如何與網絡專家通力合作?這些都需要慢慢解決。
盡管醫療大數據仍面臨不少困難,但廣闊的市場前景是毋庸置疑的。作為一個醫者,我很關注大數據在以下幾個方面的應用:
臨床決策支持
讓誤診誤治大幅減少
臨床中遇到的疑難雜癥,有時即便專家也缺乏經驗,做出正確的診斷和治療更加困難。臨床決策支持系統可以通過海量文獻的學習和不斷的錯誤修正,給出最適宜診斷和最佳治療。以IBM Watson為代表的臨床決策系統在開發之初只是用來進行分診的工作。而如今,通過建立醫療文獻及專家數據庫,Watson已經可以依據與療效相關的臨床、病理及基因等特征,為醫生提出規范化臨床路徑及個體化治療建議,不僅可以提高工作效率和診療質量,也可以減少不良反應和治療差錯。在美國Metropolitan兒科重癥病房的研究中,臨床決策支持系統就避免了40%的藥品不良反應事件。世界各地的很多醫療機構(如英國的NICE,德國IQWIG等)已經開始了比較效果研究(CER)項目并取得了初步成功。
試想有一天,大數據系統成為診斷和治療建議的提供者,內科醫生是否還能坐的安穩?因為它掌握的信息量要比人多的多,判斷的準確性要比非經驗得出結論更可靠。不過,外科大夫也不要笑得太早。對手術路徑和流程的大數據采集配合機器人等的程序化操作,也許有一天也會取代已經成為圖騰的柳葉刀。
遠程監控診療
提高家庭護理質量
從遠程監控系統收集數據,并將分析結果反饋給監控設備及人員,從而實時診斷并確定治療方案。目前已有醫院通過結合手機App軟件等方式,進行心率、體溫及血糖等的檢測,但檢測的內容仍很單一。臨床上希望針對不同病種開發一些診治后輔助系統,可以減少病人住院時間或門診復診次數,提高家庭護理的比例及質量,也幫助醫院和醫生鎖定患者群。北京大學腫瘤醫院目前正在開發此類軟件,并有望和IBM、希捷等公司進一步合作。
公共衛生監管
快速檢測傳染病等
衛生主管部門可通過監控數據庫,實時統計分析,快速檢測傳染病、院內感染等情況,并進行快速響應。同時也利于網絡覆蓋地區發病及診治情況的數據匯總。如果將整個數據系統整合,不僅有利于整個體系內的醫療資源分布和供給,也便于實時監管和調控。
大數據,尤其是公共衛生的大數據從本質上說應該是國家資源,它的安全也應該納入國家安全。開發者應該認識到這一點,國家也應該認識到這一點,盡快出臺相應的制度和規范來規避風險,讓大數據更符合國家的利益、人民的利益。