精準醫學是指充分考慮了基因、環境、生活方式、個體差異、疾病特征等各個維度的數據,在正確的時間為正確的患者或高危人群提供正確的診斷、治療或預防措施的一種醫學模式。
美國國家科學院下屬的國家研究委員會的報告提出:“要建立這樣一種醫學模式:將個體的臨床信息和分子特征用來構建一個巨大的疾病知識網絡”,從而“根據患者的特定疾病易感性不同、所患疾病生物學基礎和預后不同,以及對某種特定治療的反應不同,而將患者分為不同亞群。”最終要實現“精確診斷和個體化治療。”疾病的分類是精準治療的先決條件,要實現這個目標,需要將個體的臨床信息和分子特征用來構建一個巨大的“疾病知識網絡”。
在精準醫學發展中,醫療衛生信息技術扮演著不可或缺的角色。其中以電子病歷為核心的醫院信息系統,為精準醫學知識網絡的構建起支撐性的作用。美國醫學信息協會最近就電子病歷系統的發展現狀和未來的發展方向做了一個調查,并發布了一份調查報告。該報告為對電子病歷未來5個應用方向并提出了10條建議,其中明確提出電子病歷對精準醫學計劃的支持。
精準醫學知識網絡的構建
精準醫學的實現,需要將分子生物數據、臨床數據、社交數據、生活環境數據等整合并構建一個精準醫學知識網絡,目的是“為不斷擴增的疾病有關數據提供一個有力的管理機制,讓研究人員、醫務人員、患者及相關人員可以訪問、更新的疾病知識網絡”。
構建精準醫學知識網絡是在整個醫療生態系統中建立一個“以個人為中心”,各個層次的信息之間有關聯關系的信息共享空間(Information Commons,IC)。為醫生的診斷提供更全面的數據支持,同時提供從事生物醫學研究的科研人員可訪問的臨床信息,推進生物醫學的研究。
精準醫學知識網絡是一個多層級的結構(見圖1)。把一類生物分子或一種表型視為一個變量,相同變量的數據形成一個信息層。數據包括臨床診斷和病理分析等表型信息(例如,實驗室檢查數據、影像數據、用藥數據等);還具有各種生物分子信息,包括:基因組、轉錄組、蛋白質組、代謝組、脂質組和表觀基因組等。此外,精準醫學知識網絡還應該包括個人監護設備采集的健康信息、互聯網反映的社會行為信息、個人行為信息、環境信息等。精準醫學知識網絡中每個信息層通過中心節點與其他層以多對多方式相連,形成生物信息通向疾病與健康層面的知識網絡,從而獲得有意義的聯系。
(圖1)精準醫學的知識網絡
電子病歷在精準醫學知識網絡中的作用
對于精準醫學知識網絡而言,電子病歷不僅作為數據整合的載體,還是作為驅動研究的工具,促進數據轉化為科學知識。
1數據整合
電子病歷是精準醫學的關鍵支撐,是精準醫學知識網絡的主體之一。新一代電子病歷的建設以患者為中心,相對全面地整合了醫院各個臨床業務系統的數據。將每一個患者在醫院內發生的所有臨床活動所產生的臨床數據集中整合在一起,便于進行科學分析和交換共享。從這個角度看來,也切合了精準醫療“以個體為中心”的理念,滿足個體的臨床數據收集要求。
2、驅動數據到知識的轉化
精準醫學知識網絡是一個動態更新的生態系統。伴隨著臨床與科研的迭代更新,知識網絡也將得到更新。學習型健康醫療系統(Learning Healthcare System)是精準醫學的基礎,是美國醫學研究院于2007年提出的概念,學習型健康醫療系統是在醫生和患者有機協作的醫療場景中,實現最佳實踐證據的產生和應用,驅動臨床研究,確保醫療質量、安全和創新。信息技術使精準醫學貫穿健康學習系統的整個生命周期,電子病歷是核心的工具,在健康學習系統生命周期的各階段都發揮著關鍵的作用。將臨床與研究生成的數據載入電子病歷中,通過科學的數據分析和挖掘將數據轉換為信息,然后將信息轉化為知識,而知識又能夠影響個人的行為并指導臨床實踐。(見圖2)。
(圖2)臨床-科研協同促進精準醫學的發展
支持知識網絡的電子病歷建設
通過借鑒其他國家研究機構的經驗,總結出支持精準醫學知識網絡的電子病歷應具備的幾個重要的特點:支持分子生物數據的整合、支持數據的開放共享和結構化、數據的標準化和結構化,以及臨床決策支持。
1、分子生物學數據的整合
電子病歷是精準醫學臨床數據的主要來源,精準醫學的研究需要建立基因型與表型之間的關聯模型,而描述患者的表型主要來源于電子病歷。許多研究報道了電子病歷整合分子生物學的數據。美國國家人類基因組研究所(NHGRI)資助的電子健康檔案和基因組網絡(eMERGE)項目,該項目的突出貢獻在于驗證了電子病歷與人類DNA的數據庫整合可以推動基因與表型的關聯研究。將電子病歷與基因數據庫相連,利用電子病歷來描述表型特征,使全表型組關聯研究(phenome-wide association scans,PheWAS)在醫學上的應用成為可能。多項研究將藥理遺傳學檢測結果整合到電子病歷中。Masys等人總結了電子病歷整合基因組信息應滿足的7項必要條件,如表1所示。提出了一個框架將基因組層面的數據整合到電子病歷中。
(表1)電子病歷整合基因組信息應具備的必要條件
分子生物學數據整合與電子病歷系統整合的標準化工作早在10年前已經開展。HL7 International成立了專門的Clinical Genomic工作組,此工作組的工作內容是開發出相應標準并促進個人基因組學數據與臨床信息系統的交換。
2、數據的開放共享
數據被利用的前提是開放和共享。由美國ONC發起的Blue Button Campaign項目驗證了提供數據訪問的接口能夠促進患者、醫務人員和開發者的參與度和創造性。在中國無論是國家政策還是消費導向,都促進了“互聯網+健康醫療”的應用和服務的發展。因此,開放數據訪問接口,對于發展醫療信息化新業態也有積極的影響。電子病歷系統的開發者應當在保證數據安全和患者隱私的前提下,為研究人員和其他系統的開發者提供基于標準的API[9],以支持外部數據和知識源的整合。
3、數據的標準化和結構化
數據的標準化是互操作性的基礎,同時也有利于數據的二次利用。關于數據的標準化工具,美國國立醫學圖書館(NLM)開發了一體化醫學語言系統UMLS,包括醫學術語的命名、標準的分類和編碼,UMLS包括語言翻譯、自然語言處理及語言規范化的工具,對臨床文本的規范化有重要的作用。
電子病歷中非結構化文本是制約電子病歷二次利用的重要因素。獲得結構化數據主要有兩種方式:結構化錄入和后結構化。結構化錄入要求系統足夠智能的滿足臨床醫生病歷輸入效率和適應多種不同疾病的病歷模板。后結構化是將已經存在非結構化醫療數據轉化為結構化數據,這涉及一系列醫學自然語言處理技術,包括:“醫學命名實體識別”“命名實體自動編碼”“命名實體修飾詞識別”“時間信息抽取”等多種技術。作為信息抽取的關鍵技術,醫學信息抽取一直是醫學自然語言處理的研究熱點。
4、臨床決策支持
隨著精準醫學相關知識的不斷涌現,依靠領域專家掌握所有疾病的分型幾乎是不可能,因此需要臨床決策支持系統傳遞知識。臨床決策支持系統與醫生的工作流程相融合,醫生可在工作流程中實時獲得決策支持。如各種事件監視器系統可以在用戶完全不干預的情況下發出相應的警告和提示、智能檢索歷史數據和知識庫,輔助下達醫囑等。
此外,可為精準醫學設計專門的臨床決策支持系統,實現臨床數據與組學數據自動整合。目前電子病歷對基因組學數據的整合和呈現的能力有限,因此開發自動化的臨床決策支持系統,將有廣闊的應用前景。
電子病歷對精準醫學知識網絡的建立可以發揮重要作用,包括支持分子生物數據的整合,支持數據的共享開放,支持數據的標準化和結構化,支持臨床決策。新型電子病歷向基于標準化、集成共享、互聯互通的趨勢發展,將促進精準醫學知識的整合、關聯和傳遞,為精準醫學知識網絡的構建起到關鍵的支撐作用。