由劉軍牽頭的清華大學醫療大數據中心近日在清華大學校園內揭牌成立。該中心由清華大學統計學研究中心與安諾析思國際咨詢(Analysis Group)聯合發起成立。
劉軍表示,與其他大數據相比,醫療大數據復雜性更高,需要多層次的知識積累,難點在把知識和數據結合起來。“如果只是說把數據簡單做一些集成,形成簡單的觀察表象上的相關性,畫幾個圖,其實是把很多本質性的東西忽略掉了。在這些基礎上怎么進一步去挖掘、去尋找、去預測,這是一個非常大的問題,不論是從學術上還是到實踐上都是非常具有挑戰性的。”
他介紹說,在與醫院進行合作時發現,有許多醫院的構架、構造以及數據平臺存在許多缺陷。“如何將第一線真正的經驗和需求與理論方面的數據研究打通,是我們非常重要的一個課題。”
劉軍表示,中國非常需要醫療大數據。從民生的角度看,隨著人口老齡化,疾病健康的需求會越來越高,而醫療資源相對來講還有很大局限性。如何把醫療在平均的意義上提高,尤其在一些偏遠地區,在一些不容易接觸到好的醫療設施的地區進行提高,這是國家層次上非常重要的問題。“通過數據平臺,通過人工智能方面的研究和發現,來提高一般人的病情診斷、疾病預測和疾病預防等等都會起到非常好的作用。”
從商業上來講,醫療大數據也是非常重要的課題。藥物發展、精準醫療與大數據的利用都有聯系。“比如將生物分子、遺傳因子、病癥病狀的數據相結合,更精準地來預測哪種藥物更有效,這是未來要實現的一個目標。”劉軍說。
美國的醫療大數據發展多年,從政府層面投入很大。劉軍介紹說,美國在全國范圍內建立起了20幾個中心,負責收集附近州縣的醫療數據并整合,中心內有專門的研究人員,各中心之間也有聯系,搭建了一個可研究的數據平臺。
他表示,醫療大數據是一個投入大、見效需要時間的領域。美國醫療大數據研究剛剛開始進入比較有成果的階段,今后五到十年,會有更大的、更全局性的效果出來。
劉軍說,中國也可以建立一些這種中心,重要的是把數據結構統一化,將醫療具體的病例、案例或者診斷標準化,把數據結構進行推廣。“作為醫院來說可以用,也可以遵循,也可以從國家的角度來調動數據。”
目前國內在醫療大數據領域的相關法律法規尚待完善,學界和醫療界對此也有很多呼吁的聲音。劉軍介紹說,美國國立衛生研究院(NIH)有很多規定,比如如果是政府資助的項目就一定要在多長時間內把數據提交到國家的平臺,然后國家根據各種規定,把數據的敏感性去掉之后再給研究人員使用,使用的過程也非常嚴格。
“大數據的一個重要特點就是需要共享。數據是非競爭性的資源,不像能源,你用了我就用不了。”劉軍說,大數據研究很多情況是,可能單一個數據看不出來,要把幾類數據融合到一起然后會有比較有意思的新發現。這就需要把各類數據或是相關的數據有機結合在一起,需要各個部門的合作。“如果大家把這些東西都藏在自己腰包里的話,有可能誰都做不出任何東西出來。所以如果能從國家的角度統籌調度,會有更好的效果。”
對于普通人來講,醫療大數據將為個人就醫提供很大便利。劉軍解釋說,一個病人來就診,大數據研究的一些結果可以提供幫助,例如根據其他與他病癥差不多的人是如何治療的,治療的結果怎么樣,吃哪些藥,有一些什么樣的作用,一些什么樣的副作用,價位如何。得到這些信息后,可以幫助病人就醫,同時也是幫助醫生做診斷,做藥物推薦等等。
劉軍是國際知名的統計學家。他在貝葉斯分析、蒙特卡洛方法、生物信息學、遺傳學等領域做出了一系列奠基性的工作,對統計理論、復雜系統優化、基因組學、信號處理等領域都產生了非常深遠的影響。2002年獲得統計學界的最高榮譽COPSS獎,2010年獲得華人數學界的最高榮譽晨星應用數學金獎,2012年獲得泛華統計協會杰出成就獎。2010至2013年間擔任《美國統計學會會刊》(JASA)的聯合主編,他還是國際數理統計學會會士(IMS Fellow)和美國統計學會會士(ASA Fellow) 。
“我一直認為統計是數據分析的靈魂,也是數據挖掘非常重要的思想方法和手段。”劉軍說,統計界里的華人力量非常大,有很多一流的人才,比如美國各大一流的統計系都有很多華人,哈佛統計系終身教授有三位是華人,斯坦福統計系終身教授有兩位是華人,賓夕法尼亞大學、哥倫比亞大學、耶魯大學每個大學都有兩到三個甚至是更多的華人教授。
“這些華人教授不是給人家作為裝飾的,而是真正是在系里,各個方面起到重要的領導作用和地位。”劉軍說,美國的華人階層對數據有非常強的實力,如果能參與中國大數據發展將有非常大的優勢。“我們已經開始嘗試合作,參與中國大數據發展,未來會有更多人參與其中。”
(來源:財新網)