13日下午,智慧醫療院長峰會順利進行,此峰會由北大人民醫院院長助理信息中心主任劉帆主持,醫渡云科技公司CEO孫喆以《醫療大數據,智慧醫院的根基》為主題,做了精彩的演講。以下為演講文字實錄:
很高興今天有機會跟大家做一個分享,也特別巧,今天正好來的前面幾位講者跟醫渡云有過很多交流,也有過很多合作。剛才胡院長談到的問題也是我們從13年開始做這件事情的時候碰到最棘手的問題,我將醫渡云這三年做的一些工作和大家做一個分享,也是看看針對胡院長談到的這些問題,我們醫渡云是怎么來解決這些問題的。
剛才胡院長談到了,上午我們討論Alpha Go,討論這件事情的核心點在于說現在Alpha?Go很熱,Alpha Go是不是真正的人工智能呢?實際還有很大的距離,圍棋是策略比較明確的,對于每一步該如何走法以及下一步能選擇的策略點是有限集,計算機在有限集的情況下一定比人類做的更好。大家可以看到這張圖,Alpha Go學習的時候是兩步走,第一步,將今天人類三千萬的走法以及Alpha Go對應模擬出來的走法都變成一個大數據集,之后才是我們用新的算法,這些核心算法都是模擬人的神經網絡元的原理。針對想解決的問題,讓機器能建立一個全局觀,這件事情是非常了不起的事情。過去做智能系統的時候,解決不了的問題,機器本身沒有所謂的全局觀,沒辦法根據整個局勢從另外一個視角看這個問題。Alpha Go能夠把這件事情落地,在全世界雖然有很多團隊可以做虛擬學習,有很多做大數據,但把這兩者結合起來,能去應用的,全世界不超過三個團隊能做這個事情。
到醫學這塊來講,我們講到醫學的復雜度是非常高的,剛才很多講者談到這個問題,不細講了。數據量非常大,也不多講了。在這個事情當中涉及到的數據范圍很廣,人類對疾病的認知現在是限制機器像人一樣去看病最根本的原因。我們上午也在探討這件事情,機器做到60分協和主治醫生的水平,我認為今天的技術能力是完全支撐能做到這件事情的,包括美國IBM的Watson治療白血病,在最低質量安全層面上,能把這個問題解決掉。指望機器像人一樣做研究,發現一些人類在研究假設當中沒有提出的問題,這件事情從目前技術手段不太可能,也是因為數據源的限制決定的。
今天的主題是講智慧醫院,今天醫院在不斷診治病人過程中最大的積累不僅僅是累計這么多優秀醫生,還有很多醫療數據,我們的理解,醫療數據是未來中國最好這批醫院最好的競爭力。協和之所以是協和,不僅僅是協和有一大批優秀的醫生,更是因為協和有這么多年積累下來的寶貴病例。現在通過人的方式在做知識的傳遞,未來可以通過模型來做這件事情。
我們認為數據整合這些問題,它解決了三個問題,后面我們今天講的所謂對醫院的痛點,還是圍繞醫院的工作:臨床、科研、管理。我們第一個要談到的問題,剛才胡院長也談到了,這么多異源異構的數據,大醫院有兩三百個系統、不同的廠商,整個數據結構和內容都是不一樣的,如何把這些數據做到跨系統、跨醫院?這是中國的政府和醫院做了很多年的事情,但從今天來講,依然做的不是很好。醫渡云希望用自己的方式去解決問題,這是我們從技術上來講,我們從醫療業務本身,從數據庫底層看這個問題,我不太需要關心各家系統接口的事情。另一方面,所有數據都匯總到這之后,很多醫院有數據中心。下面處理的一個問題,醫院的數據并不都像研究量表表那么規整的數據,大量還是文本的數據,比如大夫今天看了一個病人,發熱有三天了,血壓怎么樣,脈搏怎么樣,他都是大段的文本。對于這類文本的數據,大家可以看到在搜索引擎上,谷歌、百度做了很多NLP的東西,但是醫學上沒有做NLP,醫渡云做了這件事情。大夫用的影像數據實際更多用的是影像結論,我發現這有一個病灶,我把這件事情記錄下來,把這件事情帶到我所有模型當中去做應用。我們有大量的影像本身的信息是丟失的,今天沒有被有效利用。而醫院95%以上的數據就是影像數據,怎么把這些影像數據利用起來,對醫院來講,對醫療來講是非常重要的。
這是醫渡云的后結構化處理,醫院做了很多電子化的東西,我們怎么把電子化的東西變成結構化的東西。我們為什么叫后結構化呢?現在很多醫院的做法,我去做前結構化,要求大夫寫病例的時候按照一個模板,按照一個一個字段去做填寫,這件事情帶來的問題,你把每個大夫看病的周期會拉的很長,同時大夫的思路跟你的量表思路是不一樣的,所以大量的思維會被這件事情所破壞。今天技術可以支撐我們做到,你只要保障你的數據記全了,不管你怎么記的,不管書寫習慣怎么樣,叫糖尿病也好,還是漢語拼音糖尿病也好,這不重要,機器去給它做標準化。第二個是影像這一塊,剛才幾位院長談到病理很重要,我們也在做病理這件事情。但病理這件事情的核心,所有的矛盾點大家看的很明白,中國很缺病理大夫,全世界都缺病理大夫,我們僅僅通過遠程病理就能解決嗎?協和也缺病理大夫,我們要做的就是讓機器像病理大夫一樣去看片子,所謂供給側改革,我們要提高醫院的服務能力。醫渡云嘗試做的事情,把病理這個圖片讓計算機去用它的方式解讀,幫助大夫做初篩,幫助大夫做判斷。
這是一段自然語言,在醫院里類似像這樣的東西,這樣的東西放進我們的系統來,比如說“發熱”,機器標識出這是一個癥狀詞,醫渡云積累了很多醫院類似的數據詞表,這是一個積累的過程,我們在做第一家醫院的時候很痛苦,所有詞表的建立匹配度只有30%,但是我們服務過很多醫院之后,我可以覆蓋他85%的數據。你給我一份病例,我可以做到85%的覆蓋,目前還做不到100%。
ICD10是疾病的編碼,大概兩萬種,全世界都在按這個標準在做。醫院的現狀怎么樣?為什么國家推ICD10這么難?醫院寫出來的診斷,糖尿病的寫法就有很多種,即使同樣是一個二型糖尿病,也有幾十種寫法,這就是醫院的現狀。怎么把這些數據給它標準化,建立這樣的樹狀結構,我知道你講的是二型糖尿病還是一型糖尿病,雖然診斷和ICD10不是一對一的關系,但是ICD是最大的一個來源,是把數據變得干凈,變得可用一個很大的基礎點,這是我們在醫院做的一些方案,不多講了。
我們今天對醫院的理解,剛才講到也是一些最基礎的,數據怎么做清洗,核心還是要解決問題。我們將醫院拆成兩件事情,大數據是智慧醫院的基礎,能幫助醫院提升效能,大數據要幫助醫生提高醫生服務能力,遠程是一個很好的資源配置的方式,讓偏遠山區的大夫有機會讓偏遠地區的病人享受發達地區一些好的醫生的醫療服務。大數據從實際應用角度上來講,必須要對醫生不管管理病人、治療病人還是診斷病人要有數量級的提升,另外從患者角度來講,我們怎么提高患者的診療體驗,提高患者在醫院整個就診流程,這些背后都是數據支撐的邏輯。今天衛計委要解決的這些問題也來源于這,后面可以詳細討論一下這個事情。
我們先講醫生成長,我們這個公司雖然團隊都是互聯網的團隊,但我們一直是在跟大醫院做合作,所以我們的視角可能跟剛才幾位院長的視角更像一點。我們認為在今天來講,廟比和尚更重要,協和的品牌可能比協和大夫本身的價值更大。因為醫院提供了非常非常多給醫生的附加價值,不僅僅是品牌上,還有科研環境等方面的支撐。如何把這套東西更進一步的用互聯網的技術做改造,我們以科研為例,今天醫學研究,大醫院都注重科研這件事情,每個大夫都是學科的帶頭人,怎么幫助他們用現在互聯網這些手段去提高他們的科研效率,機器從你今天看到所有的患者這些數據當中,自動幫你發現很多醫學臨床上面的規律,這件事情大數據可以去做。
醫渡云和醫院合作的時候,先去把整個科研平臺建起來。我們會把一家醫院甚至很多家醫院過去積累的幾千萬份的數據放在一個平臺上,大夫不像過去一樣了,我要提需求給醫院的病案科,我要研究這二十個字段,你把數據提給我。今天在我們合作的醫院大夫,他可以做到自己在線找到自己想要的數據集,同時這個數據集不受制于醫院的系統是什么樣的。我關心頭暈的病人,我把所有頭暈的病人告訴你,同時它的分析手段不再局限于定死了三十個字段,就分析三十個字段,我可以把所有的字段扔進去,研究哪些是真正跟它相關的。
這是我們多中心的模型,比如我們支撐的一個項目,它是一個全球的多中心,里面碰到幾個問題,第一中國和國外的醫院系統差異性更大,如何保障大家在一個數據平臺上的數據做到可交換,這是我們要解決的。有些醫院有醫渡云平臺的,依然還有很多醫院沒有進入到醫渡云平臺的,我們怎么支持他的工作?為什么把結構做的那么靈活,不依賴任何廠商,你只要把數據傳上來就行了。這些就是CRF的自定義,可以做到自動的映射。
這是實時檢索,比如從兩千萬份病例尋找我要的五十個病例,可能一兩秒鐘,就跟用谷歌、百度一樣的體驗。包括在線分析、智能分析等等。另外一個大的模塊,科研只是我們說數據使用起來一個最簡單的場景,所有大醫院都希望把我的病例,把我的數據基于新的大數據技術,指導我的臨床業務,臨床業務核心就是去指導每個大夫下一步做什么,你為什么這么做。這是我們和一個醫院的合作,以白血病M4型為例,醫院關心的是今天中華醫學會有了一個指南,告訴我說白血病該怎么治,但是中國白血病的現狀,只有大醫院才能治白血病,對于一般性的醫院非常難治療白血病,指南上的治療是更偏保守的治療。今天計算機能幫人做的是,我會把這家醫院在M4型病人的數據,首先我把每個人建模,每個人治療過程給它模型化,讓機器去數識別,這只是為了我們建模的基礎。我們看兩千個M4型病人疊加之后的共性是什么?差異性是什么?比如對于用藥選擇這件事情,你應該在幾個月的時候換藥,骨髓移植是三個月后還是六個月后做?大數據能告訴你這家醫院過去是怎么做的,所有的決策點是怎么去做的?他會給你所有的權重,會對你的決策有很大的輔助作用。
這是我們做的一塊病理,讓計算機識別哪塊是病理區域,對于這些區域哪些是陰性陽性,機器可以去判斷。我們和國內一家很好的腫瘤醫院合作,我們做了五百例,幾乎機器做出的假陰性是沒有的,所以機器可以幫助我們去做初篩。有兩種可能性,一種可能性,機器比人看的更準,另外一種可能性,機器的標準更嚴格,他會把更多的納入陽性的范圍內。我們在這一塊場景應用更多把它設定在初篩環節。一個腫瘤醫院現實的情況,那個醫院的腫瘤科35個大夫,一天要看兩千個病理片子,他沒有精力服務更多患者。如果有這套系統,他一天能看七千到一萬張片子,這就是效率上的提升。他有了這種能力之后,才能去建華南的中心,才能去建全國的中心,這些是我們講的互聯網技術、大數據技術帶來的大的變革。包括現在談的很熱的精準醫療,精準醫療需要數據訓練,才能找到路徑的一個新的領域。
患者這端我們解決什么問題呢?慢病管理,數據很重要的,我們和醫生聯盟、公立醫院在探討這一塊,大數據能解決的是數據決策和驅動的問題。核心數據能幫助我們提升的就是在這一塊,這是我們在合作的一個醫院的模型,院外今天已經有了很多APP在做這一塊,包括我們自己投資了一些做院外管理的APP,這些采集的是院外的數據,你要和院內的數據做打通,這個打通是一個訓練的基礎。核心是為了什么呢?就是為了訓練患者的風險模型,我今天一家大型三甲醫院,糖尿病病人一年的門診量一萬五千人,這一萬五千人當中只有六分之一的留存是好的,六分之五的糖尿病病人是流失的。如果將流失的六分之五病人中的五分之一轉移回來,科室不僅僅是把管理人群增大,整個科室收益也會好很多,甚至翻一倍。傳統的做法可能去增加大夫、護士,提高醫院的醫生數量,但是今天做不到了。今天我們讓機器去做這件事情,我幫助你大夫做的是,我對你潛在的哪些病人是好的,你不需要把你所有的資源像過去一樣平均撒在一萬五千個病人身上,你要有所重點,這樣才能服務的更好。第二點,所有患者進入不同的組,根據他的依從性,根據他的血紅蛋白的指標,根據他家里面的經濟條件,讓患者出入組不要大夫去定,讓機器去定。因為這個分組不是一次性的,可能我的血紅蛋白指標好了,我下一階段不要在最嚴重這一組,可能去好一點的組。這個動態模型一定是讓機器去做,不能交給人去做。第三個,分完組之后,對患者整個管理是基于風險模型的。這套風險模型就跟我們每個人在做授信,銀行那套東西有點像,怎么讓機器對整個過程做控制,機器根據你反饋回來的數據,反饋回來的數據做動態模型的調整,給每個人以不同的方案。我們在這一塊做了很多嘗試,目標就一點,把一萬五千人中依從好的病人從一千人提高到四千人。
下一階段,后面有一些模型,就不講了。我們也在去整理一些文章,這件事情下一步有一個暢想,對患者管理,包括有些醫院跟我們探討,今天有這么多商業管理公司非常想進入醫療這個行業,患者管理我覺得是一個非常好的場景,特別慢病管理來講。醫渡云也在尋找自己更長遠的發展模式,患者管理是一個多贏的事情,對患者來講我的疾病控制更好了,管理公司如果跟公立醫院做這種合作的話,可以找到更好的付費方,幫助患者減少投入。在這塊我們也在談很多合作,包括社保,包括商業保險公司,找到一個好的方式。
最后,對醫渡云的情況做一個簡單介紹,我們從13年開始做大數據,也是北京的重點高新技術企業。團隊有三撥人,我們技術團隊大部分都是來自于百度,他們在搜索引擎有很多積累。第二撥是產品的人,基本都是阿里出來的比較多,他們對模式的設計,商業的理解會更強。第三撥人也是醫渡云與傳統互聯網相區別的,我們一個很強的醫學團隊,都是從301等等這些大醫院出來的,超過十年年資的臨床醫生加入到這個團隊來一塊做的。在這樣的團隊下,我們更愿意跟大醫院去做這樣的嘗試,把我們這個團隊價值發揮出來。這是我們部分合作的醫院。雖然離Alpha Go遠期的目標還很遠,但是這些基礎工作,不管國家在做,企業行業在做,大家目標都是一樣的,把這些數據變得可用,讓每個大夫每個醫院每個患者用起來,遠期大數據我們再去做一些人工智能的東西。醫渡云也是希望在這件事情上與更多的醫院同行一起摸索,把這塊工作做的更好。謝謝!