主持人:
大家下午好!很高興擔任今天下午的主持人,我是中國聯通研究院的李建功,今天下午是最后一個下午了,會有很多嘉賓進行精彩的分享。下面,我們首先有請美國德睿醫療咨詢(上海)有限公司總經理劉曉劉總發表演講。大家掌聲歡迎!
劉曉:
感謝大會的邀請,我想跟大家討論以下幾個問題,什么是醫療大數據?醫療大數據的潛在價值有哪些?如何實現醫療大數據等幾個方面,我自己的經歷,從數據劃分來講,也是有上上下下的變化。曾經做電子芯片的設計,本身從芯片設計出身的,后來有機會到美國去學習醫院管理,使用數據來幫助醫院提升它的運營效率還有醫療質量的水平。后來又有機會在一些咨詢公司工作,當時服務的對象很巧,也是在數據庫、商業智能、數據市場營銷這些部門來為這些企業,包括大的健康管理公司來提供服務。做的工作基本都是對數據進行分析,有超過三千萬的客戶數據,通過過往數據的分析,去預測哪些客戶可能會給這個公司帶來更多的效益,哪些客戶在未來一年內會進行再一次的采購,什么樣的營銷方式或者營銷的渠道能夠讓這個客戶更容易接受,促使他來再進行一個消費。但是到了09年的時候,回到國內,在醫療行業開始工作,大家看到數據分析的情況有一個比較大的落差。這也是我想表達的一個情況,我們現在有很多機會來做數據的應用。
回到這個主題,大數據的定義,可能很多人都看過,我不知道是不是已經有人講過了,從統一的定義上,目前還沒有看到很清晰的,大家普遍接受的。基本上三個V,從規模、多樣性到數據的速度三個層面,這是被大多數人接受的特性的描述。規模從兆到TB的變化,多樣性,能夠覆蓋的數據范圍,就醫療來講,從醫療機構內部產生的診療相關的數據擴大到消費數據,擴大到社會環境的數據,包括個人健康監測的數據,這個是可以在新的大數據范圍下去統計抓取的。速度,數據的生成,一個是數據的生成和獲取都更加實時了,除了這三個V之外,還有人提了第四、第五個V,第四個V真實性,跟前面的速度有關,更快的獲取,能夠讓我們有機會去驗證所獲得的數據是真實有效的,相對以往,我列了一個例子,拿電商的例子來看,以往通過問卷調查,市場分析去看消費者到底想買什么,購買意愿如何,現在我們在網上即使你把東西放到購物車里,這個網站運營商電商已經能夠看到你的這個動作了,所以這些數據更加真實。最后一個V就是價值。所以醫療行業的數據不管它怎么快,怎么規模大,怎么去爆炸增長,最終它能夠產生價值的這塊,這個條件是我們用這個數據來使用它做決策分析。
潛在的價值有哪些呢?更多的在講醫療行業相比于其他行業來看,數據量還不是特別大,這個圖是小孩畫的,一個飛機飛6小時,能夠有500G的數據,各種各樣的數據,這個數據可能不足夠找到馬航。個人平均一年平均的數據是100兆,數據量有很大的增長。但其他行業已經在用這個數據來做很多分析了,所以這個數據范圍的擴大,能夠讓我們能感受到,包括一些廠商,數據擴大的范圍都對我們未來的健康,個人的健康情況會有一些影響。
這個數據范圍剛才也提到了,傳統的診療數據,其他的還有很多,包括基因的這些數據,包括社會,包括我們在網上的購藥等等消費數據,日常的生活習慣的數據,都可以去進入到我們這個數據分析的過程中,包括管理個人的健康。舉一個例子,類似大眾點評網,美國一個網站,吃飯,回來做餐館的評價這樣一個網站,還有很多,包括醫生的評價都可以。藥品公司和美國紐約市政府和哥倫比亞大學做了一個合作,把這個評價里面涉及到一些關鍵詞,嘔吐、拉肚子、生病,發現三次食品安全事故。回溯,發現有問題的餐館確實有過衛生監督審查不通過的情況,這是一個公共衛生領域里面一個案例。另外在藥品用量安全監控這一塊,通過推特,像微博一樣,通過關聯詞的挖掘,發現很大量的4400個藥物不良反應,同時FDA收到傳統渠道不良反應的報告只有1400個,這里面這個數據是比較碎片化的。這里面的數據也不是很完全,并不能完全依賴于它來作為主要的數據來源,目前是把它作為一個補充的來源,幫助它進行上市后的藥物不良反應的監控和管理。
這是列了一些方法,這些方法比數據本身還要重要,包括上市后的藥物安全監測,治療有效性的對比研究,在座可能有醫療機構,醫院的,美國在醫保新的政策,從醫院出院的病人如果在六個月之內,如果出現復發再入院的情況,醫保報銷是不報的。醫院的壓力,他現在要在病人一入院進行分析,對病人再入院的風險,根據他以往就診的情況,入院以后每天的情況進行風險的一個評估,他寧可不讓他出院,也要盡量避免再入院的發生。還有臨床診療新的診斷和治療的算法,根據對某一個方案是否符合還是異常,進行一個追蹤。不同的數據在整個病人方案治療過程中的判斷,包括數據質量問題的自動化更正。這里提到一個案例,貝勒大學使用IBM的wastson通過分析挖掘通過十萬篇文獻法下了在可能治療癌癥的基酶。
除了各種炒作,報道之外,我們坐下來能看到大數據還是有很大潛在價值的。這里又列了一些經濟價值和臨床價值,挑一個來說,講一個案例,這是波士頓的partners他們跟熙康有點像,但不完全一樣,他選擇了慢病或者急重超重的人群,作為一個初步的切入點。做什么事呢?首先病人在家里面能夠做自我的監測,特別慢病的病人,他選了一個血壓和血糖,這些儀器給他安裝了無線發射的設備,這個無線信號或數據會傳送到partners電子病例系統之中,這意味著什么呢?意味著我們傳統上醫療或者醫院對病人生成的數據往往是不容易信任的,特別是很多醫生也在討論我敢不敢相信你給的這個數,這樣一個嘗試,基于信任基礎上,對消費者產生的數據和病人電子數據整合以后,能夠帶來很多便利。慢病病人90%的身體狀況,根據他自己的飲食、生活情況,正常用藥來控制的,沒有急性的情況,可能只有10%需要醫院醫生來給他進行干預,多數不需要去醫院,傳統要定期去醫院檢查,通過這樣一個系統,會避免這樣的情況。現在這個系統還有很多沒有解決的問題,也有很多計劃,包括擴大監控指標的范圍,檢驗數據的范圍。問題是財務上是否可行,誰來付費,誰來支付額外的設備和服務的費用。
醫療大數據的價值實現,整個大數據剛才提到了不同的案例,實際上它綜合的把計算機科學還有我們醫療行業的經驗結合到一起,才能實現這個價值。從兩個維度,一會兒可以看一下,一個是數據能力的提升,一個是數據能力在不同場景下,不同醫療行業的問題上,應用的場景,都要去提升。從能力上,主要的一個變化,去發現了解我們過去發生了什么,現在在很多醫院都在做報表,每日門診量,過去一年的統計數據,這只是表示發生了什么。未來發生什么,這個是要通過新的數據,新的一些方法去預測的,這是從報表監測,包括在整個醫療行為過程中,流程中,進行一些數據分析工具,可以做一些監測。看到數據基礎上,要深一步去挖,可能會在數據看上去沒有什么特別的數據基礎上,能看到一些特別的模式,這是屬于挖掘要做的事情。還有預測和模擬,是一步一步的數據能力,講的層面不一樣,解決的問題也不一樣。
另外一個維度就是講應用場景,應用場景有醫院內部的,有整個醫療行業和大健康行業的,從人群健康管理分析,這個可能更多是我們在講區域和政府在做的事情,包括對醫療機構或者醫生個體的績效,床邊的健康差異分析,健康決策支持,幫助醫生給他來做更好的診療和判斷,也可以給病人,通過門戶,通過電子健康檔案,來推送相應的數據。疾病管理或者我們講的一些臨床實踐、臨床規范的落實,以及規范和實踐自身的改進,這些都需要很多數據手段和工具。從成本上,從績效還有比較性分析,可以做很多應用。
這是可以借鑒的一個成熟度模型,這個模型也沒有得到普遍的認同,這是美國一家做醫療行業的數據分析的公司開發的。他基本上把剛才講的兩個維度并在一起了,一個就是數據分析的能力,你是用哪種分析手段做的,做什么事,應用場景,都放在一起,從我們最基本的數據報表,到基本的報表生成到企業數據庫,有自動化的內部報表,有外部報表,一直到人群健康、臨床干預,一步一步上去,也是可以探討的一個模型。
最后這個數據分析現狀,我們要分開理想和現實的差距,剛才講更多的是一些理想的東西。實際情況,目前大醫院所存儲的電子化歷史數據是比較有限的,數據比較分散,分析使用這些數據的能力也不足。直到近幾年,我們看到醫院開始關注存儲電子化的歷史數據,祝愿比門診好一些,很多醫院實施了電子病例系統,市場上現存系統的設計還是有一定的提升空間,病人不管是結構化電子病例還是什么,醫生需要錄入很多,意見很大。門診目前實施電子病例的醫院比較少,如果有的話,是在專科,跟醫生很忙有關。有一些門診就診的數據可以在系統里面可以看到,有一些醫院啟動了紙質病例的微縮照相或者掃描,這是對數據保留有很大幫助。如果出現系統替換,我們會觀察到舊系統里的數據往往是不會被遷移到新系統,這意味著我們的數據使用,如果有人想用的話,要打很多折扣,如果沒有人要用,現在的情況就可以了。即使是電子化的數據,也有很多挑戰。剛才說到數據的分散,在不同系統中,格式也不一樣,缺少統一性。
結構化和非結構化的數據都是共存的,盡管電子病例的企業會致力于它的軟件能夠提供結構化的病例數據,幫助進行后期的分析。但實際的情況,醫院有大量的非結構化的數據,怎么去處理它們?有不同的方法,這是一個現實的情況。數據的定義不一樣,統一口徑不一,數據統計會主線由于定義和統計口徑不一,導致的結果不一的情況。病人統一識別缺失,另外政府報表要求非常復雜,也會有變化,包括醫保,包括醫政部門的要求,所它的要求,讓醫院花很多精力。數據分析本身這個工作也沒有一個專門的職責,往往不同部門都在做一些事情,也會導致差異化,數據不一致的情況,整個機構的能力相對比較弱。這個是最重要的東西,醫生還是比較忙的,過去幾十年里面變化不是很大,越來越忙。真正他們有機會去使用電子化數據,比較復雜的數據模型,去做一個臨床也好,做研究也好,這是一個經驗模,這個經驗是過去很忙的時間,沒有給他機會來做的。臨床去做數據分析,這是一個循序漸進的過程,有的機構做臨床數據中心做過了,驅動力不是在真正臨床上。醫院運營這塊也面臨很多壓力,不管是醫保還是醫院之間的競爭等等這些壓力越來越大,所以他們的需求是比較切實的。圍繞它的需求,開展工作,感覺效果更好一點。
除了醫院之外,我們也講區域醫療,這部分有很大的愿景,目前項目開展的非常多,特別是數據平臺,基本大家都要去做這個工作。整個項目的建設還是在比較早期的一個情況,實施的策略以數據收集為主,抓取為主,沒有太關注分析。我就不再念了,時間也比較有限,大家可以看一看。我不知道有沒有政府部門,可以關注一下。一些領先機構面臨的問題可能在全國都有普遍性,國內跟國外的解決方式會有差異,像加拿大它的身份匹配,除了個人身份證號之外,名字、家庭住址等等來匹配。但是我們知道中國醫療機構收集到這些數據都不是很準確的,通過這些不準確的數據,用它同樣的算法去匹配,這個也不是很好用。所以借鑒其他國家做法的時候,還是要注意的。我們建議在區域這塊,能夠開展一些分析工作,有一些數據收集起來了,數據收集工作量就非常大,如果看不到一個階段性成果,可能投資方不一定愿意一直投下去。
最后就是關于數據分析能力提升的建議,數據分析有三個階段,一個是數據獲取,一個是規劃供應,還有數據分析,在每個階段應該做不同的事情。如果大家有興趣,我可以把幻燈發給大家。數據獲取,爭取把數據獲取過程和業務集中在一起,不是人手工錄入。這里面講的人、流程和設備都要去進行控制,這是產生我們電子數據進入系統的一個來源。有一個美國退伍軍人的醫療機構,很多醫院,他們做了很多數據,電子病例有三代的產品,數據挖掘數據分析有很多經驗,他的經驗可以作為一個結束,可以借鑒,可以確定的數據增加,不管在機構里面還是在區域層面。對分散的數據整合非常重要,數據產生,我們希望臨床工作流程和數據分析能夠結合起來,有所應用。數據治理模式,這是在很多醫院里面缺失的,數據質量、數據獲取相關的機制和流程是很重要的。以臨床、研究和管理等數據分析需求來驅動,不管是大數據也好,還是數據分析,以需求驅動,這樣整個規劃設計,數據庫的設計,都會跟你需求有關,你準備怎么分析,分析什么數據,做什么事,這會影響你的結構設計。同時要建立分析手段,分析手段分析的能力,下面也有一些可以參考的模型。這是我的郵箱,謝謝!
主持人:
劉總與我們分享了很多大數據在醫療行業的一些實際案例,包括后面也是給我們提了一些大數據在醫療或者在電子病例這方面的一些挖掘和分析的東西,還是蠻有干貨的,包括這里面提到一個點,美國把病人居家的健康監測的數據和醫院電子病例數據進行整合,可能會有更多有價值的分析的東西能夠挖掘出來。我們再次感謝劉總給我們分享了醫療大數據的一些案例和經驗,謝謝劉總。接下來發言的嘉賓是來自東軟熙康科技有限公司的副總裁蔡鴻宇,蔡總給我們帶來的主題是云時代的健康醫療,有請蔡總。