為了推進數據整合和信息共享、發展以數據為基礎的醫療健康服務體系,11月28日至29日,“2015中國醫療健康大數據峰會”在北京召開,此次會議圍繞“開放、變革、發展”的主題,邀請主管部門、科研機構、醫療機構、優秀企業、市場研究機構等領導與專家、高層及800余位行業精英參與,深入探討科學推進醫療健康大數據的應用和價值挖掘、推動醫療健康大數據依法有序開放、醫療健康大數據互聯互通、數據標準與安全等醫療健康大數據相關熱點議題,為我國醫療健康的數據的發展提供前瞻的思想與觀點,為研究制定促進健康醫療大數據應用的政策和戰略獻計獻策。
在28日下午舉辦的醫療健康大數據應用與創新論壇上,北京大學人民醫院醫學信息中心研究員何雨生作了題為《醫療大數據成熟度分析》的精彩演講,以下為演講實錄:
我分享的東西比較另類,大家去淘寶買東西首先看差評,因為好評的東西太多,你不知道它是不是水軍,是不是托兒。我自己不是差評師,不是靠托兒掙錢。
我的主題是健康醫療大數據有用嗎?我們更應該用大數據應用的成熟度,這個往往是和各級領導,包括公司領導、用戶忽視的。李廣國(音)教授分享一篇文章,中國區域信息化過熱,引起部領導的意見。像網站上的差評一樣,可以使我們很冷靜地看待一個行業,現在有一個詞是精準創新。大躍進的產生和大躍進的問題,2005年前副總理姜春云寫過一本書,叫《橋和船》,重點討論方法學。中國人特別是受摸著石頭過河這種觀點的影響,可是在方法學上摸著石頭過河是過河最差的方法。沒有任何過河方法的時候,可不可以問問別人,已經過河的人,哪水淺。或者我們找一條船,不僅我們能過河,其他人也能過。摸著石頭過河是不得已的情況下采取最差的方法,不應該作為常規方法。我們做國內很多事的首先,都自覺不自覺地首先用摸著石頭過河去做事情,這是導致大躍進產生的問題。知識分子會干出更壞的事情,這是錢學森用理論證明,怎么樣可以畝產三萬斤糧。毛澤東是農民出身,他懷疑畝產達到達不到萬斤。經過錢學森論證,毛澤東也認為畝產可以超過萬斤。我們畝產這么高,全國的糧倉放不下這個糧食,所以大鍋飯隨便吃,吃了一年大家開始餓肚子,沒有東西吃了。我們對這件事評估完全錯位,導致后面非常災難性的結果。
現在在討論成熟度曲線。有一個笑話,一個傻子吃了三個燒餅吃飽了,這時候他恍然大悟,我當時吃最后一個燒餅,省了兩個燒餅就可以吃飽。
下面的曲線是成熟度曲線,任何一類項目、技術、應用,都要經過成熟的過程。這個過程分為五期,一是萌芽期、二是過熱期、三是低谷期、四是攀升期、五是成熟期,萌芽期媒體大肆宣傳。我們區域信息化嚷嚷得非常兇,基本上我們可以評估區域衛生信息化這個領域的應用,在這樣的成熟度曲線中仍然是萌芽期、過熱期,開始步入低谷期。后面會看到,經過2010-2014年經過特別過熱的宣傳以后有了很大的冷卻,因為這項技術存在問題,在它的普及過程中必須克服掉關鍵技術應用,社會管理方方面面的瓶頸,才有可能進入攀升期。把投資投在這個項目,恰恰在于過熱期到低谷期,以至于萌芽期的時候,這個公司的風險就極大,你怎么知道你是百萬里面唯一成功的一家公司。高曉松說過一句話,歷史不是鏡子,歷史是精子,淘汰千千萬萬才有一個成活下去。這項技術發展到攀升期,到成熟期的時候,這個時候更多人可以活下來,整個的行業會健康發展。
這是2014年關于新技術的一個成熟度曲線,它的大數據成熟曲線的位置,是位于下坡路的上邊,非常靠上的位置。大家可以想,這是整個對于大數據的定位。后面大量的應用都是要失敗的,因為該在于下降期、衰退期、低谷期。實際上作為我們的管理者,在萌芽期、過熱期、衰退期的時候應該支持研究、科研、試點,而不是大規模普及。公司應該自己定位我們有沒有能力突破衰退期、下降期,達到后面成熟的過程。假如有這種能力突破關鍵的技術應用、管理的瓶頸,你才有可能成功。假如說你沒有這種能力,在這個階段的投資是一定要失敗的。這件事是一個很復雜的事,大數據是一個非常大的應用領域,包含著大量的、不同分類下的應用問題、技術問題、管理問題政策問題、法律問題等等。一概地、籠統地討論大數據的成熟度是有問題的。所以我們可能每一個人從不同角度,像管理者、應用者、開發者、研究者,從不同的領域、不同的資項目要準確地定位,你要做的項目它的成熟度會怎么樣。你有沒有能力通過你的團隊、你的技術、你的投資克服這些瓶頸,使它進入平穩發展期和成熟期,這樣才有可能成功,這個可能叫天意。假如說你的投資、你的突破放在啟蒙期、過熱期的時候,即使你有非常聰明的能力,你也不能很快度過這個階段。我們每一個人做決策的時候,都是畫你這個項目的成熟度曲線,來準確定位你這個項目在這樣的曲線里位于什么樣的位置,它所碰到的關鍵問題是什么,你們的團隊有沒有能力解決它。
大數據有各種各樣不同的分類,可以按醫療大數據的技術分類,像數據獲取、數據處理、數據分析等等。可以按數據倉庫的技術分類,數據獲取、數據清洗、數據整理、數據分析。我是按照應用類型分類,角色的分類,衛計委46312的類型分類,還有醫學研究的分類。我們不可能把每一類的東西認認真真討論,我也沒有能力把每一類問題都說得非常清楚。這樣的分類說明,醫療大數據涉及到方方面面,每一個子領域的子領域成熟度是不一樣的。剛才各位講的醫療大數據的案例是很成功的,說明很多子領域很好地應用。我們系統數據不完整,我們仍然可以做挖掘、計算、分析的工作。我們項目的定位,能不能和我們做的工作匹配,這是非常重要的。
區域衛生信息化大數據。區域衛生信息化是全國,包括全世界醫療衛生最熱的領域。46312就是共產主義目標,比大躍進還要大的共產主義目標。像皇帝的新裝一樣,總要有說皇帝沒有穿衣服。早說皇帝沒有穿衣服比晚說,對于我們的國家、我們的用戶、我們的開發者都是利大于弊。就像淘寶的差評,可以讓你更全面、準確地認識一個領域。
我在美國做一年多,有一個課題是追美國區域衛生信息化的發展。2004年的時候,美國醫療區域衛生信息化的喧囂期、鼓噪期和過熱期都是美國人弄起來的。那個時代美國人也認為很快可以把所有的醫院拎起來,共享電子病例,可以做流行病學分析、可以做統計、做決策支持、讓任何一個醫生在任何一個地方把病人病例調出來。有一個病人裝了心臟起搏器去旅游,突然昏迷過去以后,就送到醫院做核磁,那么就把心臟起搏器就打了,這個病人就死了。美國哈做過一個調研,美國全部科室用了電子病例的沒有超過10%。我們先讓醫院把電子病例科技,再去共享電子病例才是可能的。美國2000年以后逼各個醫院上評審電子病例、制定規則、讓CMS,這些醫院和醫生必須用電子病例。美國下一個十年,還是要做互操作,就是讓電子病例共享。我們現在的規劃,不但是3521,而是46312,這和我們幾年趕超,幾年趕美,和大躍進的時候一樣。我們要清晰地認識到,像錢學森干的確實一樣,大家在推波助瀾。
區域共享,我們建立各種各樣的頂層系統,特別是底層的地基沒有建,最基本的醫療信息交換的編碼沒人做。大家可想我們的大廈應該怎么建,建成什么樣子。
衛計委也在開始調整,包括張鋒主任也說,“十三五”的規劃很重要的是抓數據質量,不光是區域信息化,包括臨床信息化、公共衛生信息化,數據質量是最基礎的,也是大數據分析最基礎的東西。我們只有數據質量越高、數據量越大、數據越完整、越標準化,我們做其他的分析更好一點。標準服務和云測試,這是非常重要的工作。
我只是從成熟的角度來提示,我們有很多的工作,應該非常冷靜地去考慮這件事。怎么樣去定位,怎么樣合理地制定階段性目標。當然在醫療大數據里,還有很重要的就是,真正的臨床大數據,臨床大數據現在全國非常之熱。包括國務院最近很快要發這個文,就是醫療健康大數據應用指南。國務院準備在大數據中抓幾個領域的應用,作為大數據的試點領域,在抓緊試點,因為我是醫院管理研究所幫助制定規劃。當時做調研的時候,也請全國很多做臨床醫療大數據和工作的匯報。甚至很多在現項目拉得很大,他們都不太了解國際上怎么做,怎么樣標準化。FDA早就建立了一套標準,像臨床的一系列標準一樣。我們國內做這樣項目的時候經常不看這些東西,自己拍腦袋,我們就可以彎道超車。剛才和劉經理還討論,彎道超車是對的。而彎道超車能夠超成功的絕對是少數,絕大多數人在彎道中被甩出去,我們有沒有能力和機制,我們能不能認識到怎么樣彎道超車。我們希望站在巨人的肩膀上,可是往往是站在巨人的腳上做事情。這個時候不要考慮彎道超車,彎道能追蹤別人就不錯了。
我在美國的時候做基于本體的電子病例,我帶一個國內的博士后,他說我怎么越做越糊涂,這就對了。因為我們國內做的大量工作是追蹤,追蹤不需要你了解所有的東西,你只需要找幾個非常優秀的案例、方法,你照著它學,重復就可以。可是你要想超越,就像堆一個沙山,必須把周邊的坑全部填滿,才有可能堆得比別人更高。我們需要培養自己的不是追蹤能力,而是超越能力,像區域信息化,我們沒有什么可以追蹤的,因為全世界大家都不熟悉,都不理解。現在我們的規劃是超越的規劃,我們有沒有能力把沙堆周邊的坑填上,把沙堆填得更高。
醫院His大數據已經更成熟,技術需要方方面面的東西,來適合你這種需求的應用。
這是我們和國外大學做的,我們希望用本體的方法表達病例的知識,很重要的是放在醫學數據質量,或者用本體的云網的方法,去獲得更高質量的臨床數據,來為臨床大數據分析奠定基礎。謝謝。