為了推進數據整合和信息共享、發展以數據為基礎的醫療健康服務體系,11月28日至29日,“2015中國醫療健康大數據峰會”在北京召開,此次會議圍繞“開放、變革、發展”的主題,邀請主管部門、科研機構、醫療機構、優秀企業、市場研究機構等領導與專家、高層及800余位行業精英參與,深入探討科學推進醫療健康大數據的應用和價值挖掘、推動醫療健康大數據依法有序開放、醫療健康大數據互聯互通、數據標準與安全等醫療健康大數據相關熱點議題,為我國醫療健康的數據的發展提供前瞻的思想與觀點,為研究制定促進健康醫療大數據應用的政策和戰略獻計獻策。
在28日上午的高層演講中,上海市兒童醫院院長于廣軍作了題為《醫療大數據研究的價值與實踐探討》的精彩演講,以下為演講實錄:
大家會理解,一個院長談醫療的大數據,這和我原來的工作背景有關系。2006年開始我在上海做大型的區域醫療項目,這個項目做了以后,后面很自然地衍生到這么多數據如何利用,關注點就轉移到醫療大數據的研究方面。我今天既是院長,也是國家衛生共享工程技術研究中心,這個中心是多個機構共同組成的研究性機構。
大數據近三年是信息研究的焦點和重點。2012年我們看到大數據這個概念,看到一些報告,但是那個時候響應的人還是比較少的。2013年關注的人逐漸多提高,上海2013年提出大數據三年行動計劃。2014年國家科技部發布了關于生物醫學大數據863的計劃,2015年國務院也發布了關于大數據的相關指導性的意見。大數據概念大家談得比較多的,還是維克托.邁爾—舍恩伯格的書里。
醫療大數據和醫療信息化的發展是緊密相關的,醫療信息化的發展,一方面是它采集的數據范圍在不斷擴大,原來從單個系統,再到醫院,到數據,再到范圍逐漸的擴大。現在不僅僅是一個區域,在“互聯網+”的時代,采集的范圍更加擴展。另一方面是和信息技術快速發展有關系,技術的采集不僅是范圍的擴大,數據的厚度也加大。從數據來源講,兩個非常重要,一是物聯網,可穿戴設備,二是基因測序。奧巴馬提出精準醫學,也影響我國醫學界對精準醫學提得比較多,就是在基因測序方面。
技術的發展導致數據的厚度快速加大,除了感知的增加,在網絡、集成、資源處置方面,快速發展對我們研究和利用大數據提供比較好的技術支撐。大數據是信息時代新階段的標志,是大型的信息系統物聯網的產物,是我國實現創新驅動發展戰略的一個重要機遇。
各個國家都在把醫療健康大數據作為非常重要的一個投資領域,也建立的很多的項目。大家都在談大數據,但是很多人談大數據的時候概念在泛化。昨天我參加中國醫院宣傳的論壇,說大數據如何支撐醫院的選擇,他們講的很多是統計調查的數據。也可能大家打社會的標簽,一旦談大數據就變得高大上了。尤其是統計調查,這個算大數據。醫院也在談大數據,單個醫院算不算大數據。這里很多概念講的時候,很多是模糊的。為什么大家愿意往大數據上靠,大家要認為數據是可以產生價值,不僅僅是大數據產生價值,小數據也可以產生價值。所以不要拘泥于我這個東西算大數據,貼這個標簽。
我覺得我們現在談的大數據,更多的是針對目前信息化的時代發展,它的信息采集的范圍擴大,我們對采集的系統是一種全自動的、全流程的采集,這類的數據,我們更加關注的重點是大數據。一是全,全樣本,區別于原來的統計、抽樣調查,是全流程、全生命周期的。二是多,內容多元、數據多態。三是快,采集、存儲、處理,在線實時,有時效性。四是聯,內部干練、外部關聯分析。整個大的數據集合起來有更高的價值。
《大數據時代》這本書里,現在數據量很大,內容很多,我們用傳統的技術不能處理,更加關注思維的變革。大數據思維應該有全局、量化、開放共享、關聯、軌跡、預測思維。這些價值怎么產生是源于需求,必須有需求導向。在醫療衛生系統里關注它需求的變化,一是疾病模式的變化,疾病模式變化和人口老齡化緊密相關,從原來的傳染病為主,到以慢性病為主的疾病模式的變化。
醫療健康服務模式也相應在發生變化,從疾病診療,更加重視疾病預防和健康管理,從單一醫療到醫療公共衛生機構的綜合服務,從原來基于經驗的治療,到基于循證醫學的個性化治療。
衛生管理模式的變化,從原來醫療質量,現在醫療質量叫全流程、可追溯、能提升。醫療的發展從原來精細的管理,到全對象、大樣本量的研究。
醫療健康大數據有哪些研究和應用的價值。概括了五個方面,從健康管理、治療優化、提升管理、科學研究、藥品研發。比如說健康管理,疫情的監測,谷歌利用它的搜索引擎對流感的預測,和美國CDC的監測。二是癥狀的監測,上海世博會對各家前端做了數據的搜集。三是個性化的健康管理,現在美國有一個非常有名的保險公司,健康個性化的管理,通過給投保者發放可穿戴設備,對你的信息進行追蹤,給你提出你健康管理綜合性的建議,這樣可以減少它醫療費用的支出。
治療的優化,有兩個典型的例子,一是臨床決策支持系統。我們談到IBM的Watson醫生,對數據進行收集和分析。加上醫學文獻,給出最佳的治療建議。二是個性化的治療,對大量的病例進行匯總以后,對特征值挖掘和高相似度的匹配,這樣對這個人給出比較好的,個性化的建議。
科學研究方面,這個人生肝癌,可能從乙型肝炎、肝硬化到肝癌,是不是這樣發展的。有比較嚴格的準入和排除標準,這種結果又有局限性。為什么很多藥品在說明書上,或文獻里講治療效果非常好。但是現實世界為什么比較差,就是因為研究的局限性有關。現在倡導現實世界中的研究,這就依托于大量的電子健康檔案和電子病例的研究。流行的EDC電子注冊的研究,也和醫療大數據緊密相關。
做醫療大數據研究的時候,三個難點。一是上海的數據來源于多個系統,如何整合多元異構的數據。二是這些大數據怎么形成知識庫。三是對這些大數據的價值如何進行有效挖掘利用。
國家科技部863計劃,在2014年,在去年就進行了布局,題目是生物大數據開發與利用關鍵技術的研究。總體目標是建一個國家級、高水平的國家生物大數據中心。這個生物大數據中心是兩方面,一方面是傳統的,比如說和基因、和蛋白組學相關,另外是和臨床相關的。一方面是建大數據中心,二是從技術方面,比如說知識庫系統、注冊和可視化系統,數據注冊引擎。應用方面分為兩塊,一是針對重大疾病,腫瘤、心血管,這兩大類疾病是作為重點。同時是區域醫療和健康大數據領域。
為什么我們承擔這個課題,和我們有比較好的工作基礎是有關系的。前面趙處長介紹,我們從2006年開始,建設了上海的平臺,是國內第一個大型跨醫院的區域醫療信息中心,覆蓋38家三級醫院,18個行政區。同時在這個基礎上上海構建了健康信息網,實現了市區兩級聯網,覆蓋了全市600多所公立醫療機構。
診療事件2.1億,處方醫囑9.1億,這是量的概念。2012年開始我們關注健康大數據,2012年先給了小的項目,2013年就做了相對比較大的數據庫平臺的研究,2014年承擔國家863的課題。
這個研究過程中,首先是基于原來的信息平臺,在這個之上構建了大數據服務的平臺。從數據的融合、存儲、處理、利用層,構建一個數據的服務平臺。還有是僅僅區域醫療數據還不夠,我們要進一步豐富大數據資源中心,氣象信息、藥品信息,以及相應的也有一些可穿戴設備的試點區域的信息,以及環境的信息分到里面,對數據進行關聯和整合。
我們也在探索構建一些知識庫,根據我們臨床的病例資料,構建一些健康知識庫。在平臺、數據資源和知識庫的基礎上構建服務的平臺,這個服務有幾個面向,面向居民的個性化健康管理、面向醫生的個性化臨床決策、面向臨床的合理化用藥的分析。
我們做了研究會發現,我作為兒童醫院院長會發現,兒童的就醫是非常有波動性的規律,和環境氣侯、時間周期有關系。我們利用環境氣侯的數據、環境污染的數據、氣象的數據、患者的就醫數據,也建立了一個預測的模型,預測下來效果還不錯。未來兩周的預測就醫人數達到90%,一是引導他就醫,二是配置醫生資源。
孩子發燒以后可能到醫院就診,醫院最好應該根據病源學進行診治,以前醫生是根據自己的臨床經驗考慮他是病毒、支原體。我們根據上海多家醫院肺炎的資料,根據他前面的癥狀體征和一般的檢查,建立了病源學的模型,這樣對抗生素的應用更有針對性。為高血壓、慢性病的用藥,我們進行了臨床時效研究。把上海市三年高血壓出訪的資料進行分析,看看常規用藥模式是什么樣的,并發癥發生有哪些。規范用藥和歸到血壓的演變,對它的認知會進一步深化。包括高血壓對人體器官的損害,對眼睛、心臟、腦的損害情況,用大數據的角度研究,和原來傳統樣本的調查可以互為補充。對上海市高血壓患者的現狀,我們會有一個更好的把握。
上海的衛生局,都會對院長進行績效考核,研究平均住院日,還要有費用。不同的醫院特點不一樣,我們原來比較的數據是粗糙的。大數據能告訴我們是什么,對于病因學的研究,還需要由其他方面進行輔助。
在醫學大數據研究中業面臨一些問題,首先是數據的隱私保護和公開,可能是大數據研究碰到的第一個問題,前面和教授也在討論。第二個問題是數據的質量。第三個問題是我們的數據存儲和挖掘的問題。第四個問題是配套政策和業務模式。
大數據的研究不是沙里淘金、大海撈針,而是提高我們分析解決問題的能力。不是說我有大數據一定會產生奇跡,而是扎扎實實從現實中解決我們實實在在的問題。不僅僅是數據本身,很可能能夠帶動外部的相關專業的發展。我覺得大數據的前景是比較燦爛的,但是近期的期望也不能抬高,對大數據也是如此,關鍵是提升數據的價值。謝謝大家。