• 首頁 > 2016第六屆移動醫療產業大會直播 > 一網數據馬立偉:大數據在健康醫療領域的智能應用

    一網數據馬立偉:大數據在健康醫療領域的智能應用

    14日上午,互聯網+醫療健康峰會順利進行,此論壇由移動健康研究院副秘書長張昊主持,北京一網數據創始人馬立偉以《大數據在健康醫療領域的智能應用案例》為主題,做了精彩的演講。以下為演講文字實錄:

    一網數據馬立偉:大數據在健康醫療領域的智能應用-智醫療網

    首先很感謝組委會給這個寶貴的機會跟大家見面。今天講一下大數據在健康醫療領域的智能應用案例,一個是在健康,一個是在臨床,一個是在中醫藥。這是去年12月中關村大數據峰會上,中科院院士介紹,是大數據還是大忽悠,大數據有三十年了,大家回顧一下,沒有一個成功落地的成果,大家能夠有一個答案,第二個,我剛才聽了前兩位專家講的,我在國內去過很多省市,說起來大家對這個大數據的概念并不是很了解。今天大家離開這個會場以后,將來再談大數據的時候,大家有一個完整的理解。

    什么是大數據?剛才大家也看了,拿一個大象來拼圖,實際上就是取決于你所在的行業,你碰見一個學IT的,他跟你解釋大數據,還有你碰到一個醫療的,他解釋的不一樣。中國大數據白皮書也談到這個問題,雖然大數據成為全社會熱議的話題,但是到目前為止,大數據尚無公認的統一定義。你要理解大數據,一定要把握住資源、技術、應用三個層次,咱們大家95%的人都是談數據,實際上你忽略了技術和應用這兩個最關鍵的層次。你站到這個層次,你理解大數據的概念是截然不一樣的。

    我是從硅谷回來的,在硅谷呆了14年,在雅虎,在蘋果轉了一打圈,基本上都是做大數據,也可以說是大數據里面的一個老兵,今天給大家把這個事希望能講清楚。第一個行業是指數據資源的整合和管理,即目前的數據庫行業,第二個行業是指數據的分析和報告,即商業智能行業。2000年在美國這兩個行業已經很成熟了,我覺得咱投這么大的資,花這么大的力氣走過別人都走過的路,沒多大意義。

    第三個行業就是指數據的價值提取、預測和優化,通俗的來說就是智能應用,這個就是全球目前在爭奪的焦點。2012年,美國總統提出了美國國家大數據戰略,把大數據譽為未來的石油。2015年習近平在十三五就把大數據定為中國的國家戰略,為什么重視這個東西?實際上大家都是在搶奪大數據領域的最高點。因為現在這個最高點還是一個空白,大數據并不是個新概念,最早起源于上世紀90年代。電腦千年蟲在98年把全球五百強公司逼的都快瘋了,干什么呢?如果你不把現有的數據轉到格式化的,能夠管理的數據庫里面,你的系統就會癱瘓,這為今天的大數據奠定了發展的基礎。

    大數據經歷了好幾個過程,2001年在美國很火,叫CRM,很多公司企業在談客戶管理。然后開始發展到數據挖掘,實際上在中國現在大家在談大數據,大部分都是在談數據挖掘,這已經是過去式了。發展到BI,就是商業智能,大家都在干什么呢?所有的數據我都有了,我怎么能從數據里面找出價值,數據怎么讓我賺錢,怎么知道我明天出門會遇到什么。后來在美國是數據深層分析,Analytics。大數據在中國炒的比美國熱,2012年正式登臺了國際舞臺,在中國很火,實際就是一個改換頭面。為什么在美國從CRM到數據挖掘到商業智能到Analytics,因為不耐煩了。到底是大數據還是大忽悠,因為你沒有見過,誰能夠有一個大數據的數據可以落地,咱們國家在做智慧城市,智慧醫療做了這么多年了,他落不了地。

    大數據的挑戰是什么呢?這是2015年中國大數據白皮書指出的,這是一個技術創新之后,應用模式不成功,人才供血不足,最關鍵的原因是沒有人。牛津大學這個教授《大數據時代》,大家都讀過這個東西,他說大數據需要的是一個復合型的人才,你可以遇到很多做大數據的人,你要碰到一個人擁有人文科學的學歷,幾乎沒有,因為什么呢?因為美國跟中國一樣,你要是學理科了,就是學理科,你從理科轉到文科或者從文科轉到理科是很難的。這里頭他講到一個設計,設計是什么意思?這是最關鍵的。你現在要做一個大的項目,一個全新的項目,你首先要有一套概念,你這個項目要怎么做,你手里面資源能不能做成,沒有,你要把這個項目做成,怎么做?他是一個領導者的才能,所以就很難。咱們今天這個行業就是醫療健康,你有沒有見過一個大夫是讀電腦專業畢業的,沒有,所以這就是為什么大數據很難,人才很少。

    下面簡單談一談大數據醫療健康,美國在大數據醫療行動最快,2012年就開始成立了全球最大的癌癥基因數據庫,聯邦機構當時投了兩億美元,通過大數據的研發,帶動其他領域大數據的研究,尤其是干細胞。2013年英國緊隨其后,2015年1月份,奧巴馬把大數據醫療推到一個更高的更詳細的層次,他提出了精準醫學,咱們大家也都談到這個東西了。這個提案主要的兩個目的,一個就是找出更多更好的癌癥治療方法,第二個就是推進個性化的健康管理。咱們很多人翻譯過來叫精準醫療,我覺得很片面,應該是精準醫學。咱們叫醫學院、醫科大學,醫療對健康這方面就把它排除在外了。

    這是去年10月份美國財富雜志上美國的癌癥專家布如克博士,第一次提出了其實精準醫學就是大數據。他說癌癥現在這個疾病的奧秘就隱藏在腫瘤的分子數據中間,你理解不了這個東西,就沒有辦法對癥下藥,這是第一次。

    2014年全球癌癥報告,12年全球新增1400萬癌癥病例,有820萬人死亡。2015年中國癌癥登記年報顯示,中國每年新增癌癥人數約430萬,癌癥死亡的有280萬人,癌癥成為中國人的第一死因。人類以往與疾病的斗爭,都是以人類的勝利而告終。我們整個人類第一次在癌癥面前束手無策,現在不管癌癥專家多少,癌癥醫院建了多少,癌癥藥物有多少,得癌癥的人越來越多,死的人越來越多,你就反推一下,那些東西都是沒用的。

    全球知名的癌癥專家呼吁,要停止治愈癌癥的研究。這是英國皇家醫學工程院的院士格里夫斯教授,他是英國國家癌癥研究院進化和癌癥中心主任,他在14年8月向全球呼吁,讓我們停止治愈癌癥的研究,他研究發現癌細胞會進化,會逃脫任何消滅它的治療方案。如果大家有經驗,我這個腫瘤不開刀,不擴散,一開刀,全擴散了,他沒說這么明白,我解釋一下,癌細胞會進化,這是最可怕的。他就建議大家不要去治愈它,不要去殺死它,要管理它,要順其自然。最主要的是要預防,面對癌癥的挑戰,你得了癌癥,你就很懸。但是人類還有希望嗎?還有希望。美國總統率先在全球提出了精準醫學體驗,旨在攻克癌癥難關。中國比他站的層次更高,2015年10月在北京,不知道咱們這里面有沒有專家參加過這次會,首都國際癌癥論壇,將體檢納入醫保,建立起國民免費或廉價體檢制度。這個不得了,因為這就是預防。

    癌細胞的形成是一個由量變到質變的過程,冰凍三尺非一日之寒。等你感覺到,你再去檢查,如果是癌癥,已經是中晚期了,只能延長你的生命。健康體檢是最好的方法,能夠做到早預防、早發現、早診斷、早干預。大家就問了,我做健康體檢,現在網上有很多文章說健康體檢不是防癌,我去年查完很正常,今年就得癌了,現在體檢中常用的兩種早發現的方法,一個是基因篩查,基因2012年被歐洲臨床腫瘤學會否定了,90-95%的癌癥是由生活方式和吸引造成的,只有5-8%的癌癥是和遺傳有關的。花了錢沒有效果,在歐洲已經被否定了。還有一個方法就是腫瘤標志物,大家做健康體檢,肯定很多人都做過腫瘤標志物。腫瘤標志物不是用于早期癌癥的,腫瘤標志物主要是應用于中晚期癌癥的治療效果和術后觀察。不信你和癌癥專家聊,我們正在合作一個新的大課題,等會兒我打一張出來,如果大家愿意合作,咱們可以一塊合作。他們根本就不看這個,腫瘤標志物不是來做診斷的,做篩查用的,是做治療以后用的。美國癌癥研究院說的更詳細了,腫瘤標志物有一個敏感特異度的問題。

    怎么預防?這個方法是有了,就看大家有沒有找到這個東西,大量的研究結果顯示,咱們國家,我提取了96年的,正常人的血液和癌癥人的血液是不一樣的。尿檢,血尿只要你用起來,用的很合理,完全可以預測早期癌癥。咱們大家吃的所有東西,身體狀況都反映在你的血尿里面。大數據預測早期癌癥,大家問大數據怎么能預測早期癌癥呢?實際很簡單,大數據就是用咱們健康體檢的常規血尿數據,血常規、尿常規,經過大量數據分析,我們可以號稱大,我們健康人的數據超過一百萬,癌癥患者超過12萬。我們用大數據來預測健康人,患癌癥的風險幾率,預測出來以后,將預測結果與癌癥患者他的血尿指標進行動態對比,我們用的是兩個全球自己擁有的技術。一個叫標準評估,一個叫人工智能模擬技術,來評估體檢者的早期癌癥風險。

    預測這個過程很簡單,只要你有健康體檢或者到醫院做血尿化驗,數據傳過來,就可以預測評估癌癥風險。大數據預測,它的可貴之處就是在預報,在癌細胞還沒有形成這個氣候的時候就給你發一個癌癥的預警,讓你做到早預防、早發現、早診斷、早干預。這是我們簡單的預測報告,我們現在可以預測12種癌癥。去年1月我們大數據早期肺癌的研究,通過歐洲臨床腫瘤學會的評審,15年6月通過大數據早期肝癌的預測研究。16年3月通過國際抗癌聯盟科學委員會的大數據早期宮頸癌的預測研究,16年4月通過大數據早期食管癌的預測研究。大數據預測具有三個亮點,早期發現的準確率超過95%。預測方法簡便,你根本不需要第二次再取樣,只要到醫院里面做健康體檢,我跟首都國際癌癥論壇的專家達成了一致,他們認為健康體檢實際是最好的方法。讓你專門去做一個防癌的體檢肯定不去,但是你每年都會做健康體檢,這是最好的渠道。

    下面給大家舉兩個例子,你說這個東西好,怎么能預防?這是一個人,我們通過發出癌癥預警,讓他從高風險降到低風險,這是一個醫院的副院長,他是去年8月27號,他的生化指標有兩項不指標。咱們在座有健康管理的,你看看這個,你能給他提什么建議嗎?健康管理實際上最關鍵的,你要對這個人的健康要給他評估,要分級,癌癥是一個,心腦血管是一個,慢病是一個,你把這三個東西解決了,下面你做健康管理很容易。現在我們已經做了癌癥,心腦血管過兩三個月就可以上市,做慢病更容易。我們給他預測出來肝癌高風險,他很不理解,我做了這么多年,第一,我對我的身體狀況很了解,第二個,我看我這個指標很健康。我們拿了他的健康報告給他解釋,你這個指標是28,在正常值范圍里面,但是高于健康人的平均值,我這樣一解釋,他就很理解。等于救了他一命,我們給他提建議,你采取中西醫結合的,調節自身的免疫力。現在你們應酬很多,有時候中午喝完了,到晚上還要喝,實際你得為自己的健康著想,第一不能熬夜,第二酒不能喝多。他三個月不到,做血尿檢查,他的這個指標就從28降到26左右,26是正常人的平均值。他就從癌癥高風險降到中風險。

    下面再給大家講一個正常人怎么從癌癥的低風險升到高風險,最后到癌癥患者。這是2012年我們一個三甲醫院的退休領導,三項指標不正常,他的胃癌是低風險,到2013年再體檢的時候,三項指標不正常升到十個指標不正常。他的五種癌癥全是高風險,2014年他沒有做健康體檢,2015年被診斷為胃癌。

    我下面快點講,這是第一個案例,第二個案例就是臨床,如果咱們在座的有心血管專家的話,你會對這三個心臟病的手術評估風險很熟悉。在中國常用的是RACHS-1,這是先天性心臟病手術風險分級評估標準,這是巴西一個醫療團隊對這三個全球常用的風險進行評估,它的結論,三種風險基本上效果全都一樣。這個是我們把它的結果拿回來再轉換一下,從大數據的角度來說,這三個模型都不合格。他們預測準確率太低,你看四三二一,四是風險最高的,死亡的人大部分都在中跟低,這個效果很差。我們跟國內最好的心血管醫院在合作,我們研發出來一個大數據的小兒先天性心臟病手術評估風險。這是驗證的結果,841個人,咱們這個效果比RACHS-1他好多了,死亡22個人,他一個人都沒預測出來,咱們預測,如果看到第五的時候,77%全在這里面,這才是第一階段,再改進的話,到五級的話,能到80%以上。

    我很簡單談談中醫藥,中醫藥大數據,習近平、李克強很關注,關注要讓中醫藥走向世界,這是咱們要努力的地方。大家也都知道從兩會,在網上談這個東西很多,我摘了幾個,結論就是宏觀性的指示、口號比較多,措施相關度不大。實際上大家想走出國門,先問一下為什么不能走出國門。你到百度文庫里面去搜,這個人講的很生動,中醫的診斷過程不能量化,一個是中醫的治療效果不能量化。咱不要說走出國門,國人都不行,量化等于科學、透明、客觀、標準化、系統化,解決了這個問題,咱就可以推動中醫藥走向世界。但是這個很難,為什么很難?它的難度,你的數據庫里面的數據,不論你花多少錢,你收集來的數據和最后你要做預測的數據天壤之別。舉個例子,第一個表你說中國的中藥都有多少,你的數據庫橫行放一下,一個標準的數據庫一般就到五百列,這可能有一萬列。阿里、百度都解決不了,如果淘寶解決了這個問題,你回家一看就看見了,如果你跟你愛人同時上淘寶看的網頁不一樣,說明他們的智能推薦已經成功了。你跨不過這一步,解決不了。

    這是一個課題,這是美國衛生部國家健康研究院還有癌癥研究所向全球招標的一個早期癌癥篩查早期風險的整合系統,他提出的這個課題的主要問題就是什么呢?CT篩查的假陽性率太高,接近30%,他要用大數據加CT,影像加上腫瘤標志物,能解決這個問題,大家對這個課題有興趣,咱們可以合作。謝謝!

    發表評論

  • 野花视频