• 首頁 > 觀點 > 醫療大數據面對的機遇與挑戰

    醫療大數據面對的機遇與挑戰

    2017-10-20 觀點 Eli

    醫療大數據面對的機遇與挑戰-智醫療網

    隨著物聯網和云計算等技術的高速發展,醫療行業的信息化日新月異,衛生信息平臺、業務系統、數字化醫療儀器與設備在醫療衛生機構迅速普及,同時產生了大量的醫療信息資源。正是這些珍貴的醫療信息資源讓我們步入了醫療大數據時代,而如何利用這些海量的信息資源更好地為醫療衛生行業的管理、診療、科研和教學服務,因此也成為了人們的關注點。

    機遇

    數據是不會說謊的,將數據作為核心競爭力,用數據驅動業務將帶來大量機遇。按照世界經濟論壇的說法,大數據是新財富,價值堪比石油。某咨詢機構的一份報告顯示,醫療大數據分析在美國每年可以產生 3000 億美元的價值,減少 8%的美國國家年醫療保健的支出,而利用減少的支出可以支持9個美國國家航天局及5個美國國家健康部每年的支出。由于國家新醫改的深入和發展,區域醫療將迎來云計算和大數據的廣泛應用;大數據技術和醫療的結合,將產生巨大的社會效益和經濟效益。

    1智慧醫療

    據統計,在美國醫院的重癥監護室平均每年有40000人由于誤診而死亡,這是多么讓人震驚的數字,卻又真實存在著。導致如此多的錯誤正是因為大多數的醫療診斷憑借的是經驗而不是科學。而大數據就是使醫療決策變為科學而不是經驗,對大數據進行有效的存儲、處理、查詢和分析,就可輔助臨床醫生做出更為科學和準確的診斷和用藥決策,而不只是根據經驗來進行判斷,可以大大提高診斷準確率。

    2遠程醫療

    遠程醫療是指利用現代通信技術實現對遠地對象的醫療服務。傳統模式的遠程醫療采用點對點的方式進行,側重于技術和設備,投入大但利用率低且不夠靈活。大數據時代,我們可以充分利用物聯網、云計算等技術來打破點對點的遠程醫療束縛,形成基于移動通信技術以及物聯網技術的無處不在的遠程醫療服務體系,這種服務模式充分發揮個體在遠程醫療中的作用,它的服務模式靈活性強,數據全面、決策迅速、關聯能力強。

    3藥品開發

    大數據技術的戰略意義在于對各方面醫療衛生數據進行專業化處理。在醫藥研究開發部門或公司的新藥研發階段,通過大數據技術分析來自互聯網上的公眾疾病藥品需求趨勢,更有效率的投入產出比,合理配置有限研發資源。除研發成本外,醫藥公司能夠優化物流信息平臺及管理,更快地獲取回報,一般新藥從研發到推向市場的時間大約為13年,使用數據分析預測則能幫助醫藥研發部門或企業提早將新藥推向市場。

    4臨床科研

    一個優秀的醫院不僅能治病救人,更能利用自己的優勢資源解決醫學難題,科研能力強弱一直都是衡量一個醫院綜合的重要指標。電子病歷的部署實施,加快了醫院數據電子化的進程,醫院臨床數據中心能讓各類醫療數據及診斷信息以數字化的形式呈現在醫生面前,醫生可以利用先進的分析技術支持自己更深層次的臨床學術研究,通過現有的醫療數據去解決更多未知的醫學難題,這也是醫院大數據平臺的最終目標。

    挑戰

    目前醫療數據的來源主要為醫療機構(例如醫院、醫學藥學實驗室、醫療康復中心等)和互聯網。面對采集的數據范圍廣、維度高、類型繁多且不針對特定的問題,大數據技術進入醫療領域仍然存在著各種挑戰。

    1數據質量

    首先,從數據量的角度來看,醫療行業的數據量與互聯網搜索及消費等行業PB級別的大數據有一定差距。即使公共衛生與醫療健康的數據量在不斷增長,但由于目前國內缺乏醫療健康信息的合理接口,導致醫療數據的采集與應用嚴重脫節,醫療數據還沒有真正釋放潛能。另外,大數據的相關技術(如NoSQL等),在短時間內幾乎不可能進入到醫院的主流技術中。

    其次,從數據質量的角度來看,醫療數據的采集由于缺乏統一的標準(例如醫院之間、科室之間標準不一等),以及采集人員的主觀錯誤或數據采集系統本身的設計問題,導致其中存在大量的不確定性。例如采集某發燒患者的癥狀信息時,假設患者處于發燒狀態,在記錄患者狀態時,使用“發燒”和“體溫 38°C”在語義上存在一定差異,這種語義信息差異會給最終的數據挖掘和模式分類模型帶來偏差。另外,統計獲得的數據分布很可能在其統計過程中被人為改變,而導致估計出的數據分布失真或者實際的數據分布根本無法獲得,導致最終的統計學習模型不可靠。

    2不確定性的度量問題

    目前比較成熟且進入實用階段的大數據模型多數都是面向藥廠和保險公司的。美國的醫療大數據應用中,面向醫生和患者業務通常較難,由于大數據模型精度有限,在安全性要求極高的醫院和醫生中其實用價值非常有限,例如,一個95%準確度的模型對醫生來說可能仍然不夠精確,因為醫生在決策時是針對患者個體的,而不是基于統計意義的。模型本身的誤差度量準則是否具有統計學理論的支持以及背后的統計學意義也值得商榷。在傳統的生物統計學中,如果基于完備的統計理論可以構造出準確刻畫 模型的統計量,那么在很少的樣本量下,模型也可以達到很高的置信水平。在統計學習模型中,希望數據的規模較大,所以需要新的誤差度量準則。比如在決策樹中,使用基尼不純度(Gini Impurity)來判斷哪個特征對數據的區分度更大,最終獲得最簡單高效的分類或回歸決策樹,這里的基尼不純度和統計學中的 AU-ROC 和 Mann- Whitney-U 檢驗十分類似,但兩者之間細微的差別是否會導致在大規模數據集上的巨大偏差有待考量。

    3人才培養

    大數據在醫療行業的具體應用,需要大量既懂醫療又懂IT技術的高水平HIT人才。然而,目前國內HIT人才隊伍建設還存在很多問題,主要體現在一下幾方面:人才隊伍的數量與結構不夠完善;HIT人員普遍配備不足;高學歷人才匱乏等。

    事實上,我們正處在醫療行業信息化的重要轉折點,需要加快高素質人才的培養,主動積極投身其中,緊跟醫療信息化的步伐,迎接大數據時代的沖擊和洗禮。

    發表評論

  • 野花视频