作者:魏麗惠,北京大學人民醫院婦產科
魏麗惠教授
北京大學人民醫院婦產科教授,北京大學婦產科學系名譽主任。中國醫師協會婦產科分會副會長,中國女醫師協會副會長,中國優生科學協會陰道鏡和宮頸病理學分會(CSCCP)主任委員,全國健康產業協會婦產科分會主任委員。《中華婦產科雜志》副總編輯,《中國婦產科臨床雜志》主編。曾任中華醫學會婦產科分會副主任委員,中華醫學會婦科腫瘤分會副主任委員,北京大學人民醫院婦產科主任。獲國家教育部、中華醫學會、中華預防醫學會、北京市科學技術進步二、三等獎多項。獲中國醫師協會第三屆中國醫師獎。發表論文300余篇,主編、參編專業書籍10余部。培養博士研究生68名。
當前我們已處在從互聯網發展到大數據時代的巨烈變革中。在信息飛快發展的大數據時代,各種信息幾乎以瞬時速度在全球傳播。習近平主席提出:在激烈的競爭中,惟創新者進,惟創新者強,惟創新者勝。作為臨床醫生面對大數據,如何站在時代的潮流中去認識、去思考信息時代帶來的對舊觀念的沖擊和理念更新,是當前我們面臨的重大問題。我們正面臨巨變時代,在當前的信息時代,大數據發展日新月異,我們需要深入了解大數據發展現狀和趨勢及其影響,樹立以大數據為基礎的科研思路。
隨著信息技術在醫學臨床和科研中的應用,臨床醫學、生物學、信息學發生交叉融合,形成了生物醫學信息學(biomedical informatics)。臨床上,隨著電子病歷的應用,在醫院中,數以千百萬份的患者數據收集并存儲。這種電子病歷所收集的數據創造了利用如此巨大數據進行醫學研究的寶貴機會。
1生命科學中的基因組學與大數據
基因組學(Genomics)研究通過DNA測序:測定組成人類染色體(單倍體)中4萬個基因30億個堿基對組成的核苷酸序列,發現所有人類基因,找出它們在染色體上的位置。并繪制人類基因組圖譜,辨識其載有的基因及其序列,破譯人類遺傳信息。此項研究在2001年人類基因組工作草圖發表,2005年人類基因組計劃的測序工作已經完成。之后,進入到功能基因組學、結構基因組學的研究。人類基因約有25 000個,基因組研究的目的就是要把人體內這25 000個基因的密碼解開,從而破譯人類的遺傳信息。這些研究推動了與人類疾病相關的基因診斷、基因治療,并基于基因組信息提出了對疾病預防、疾病易感基因的識別,對風險人群生活方式、環境因子的干預。對于單基因病,采用“定位克隆”和“定位候選克隆”的全新思路,發現了一些疾病,如遺傳性結腸癌和乳腺癌等一大批單基因遺傳病的致病基因,為這些疾病的基因診斷和基因治療奠定了基礎。心血管疾病、腫瘤、糖尿病、神經精神類疾病(老年性癡呆、精神分裂癥)、自身免疫性疾病等多基因疾病是目前疾病基因研究的重點。
中國是世界上人口最多的國家,有56 個民族和極為豐富的病種資源,由于長期的社會封閉,在一些地區形成了極為難得的族群和遺傳隔離群,一些多世代、多個體的大家系具有典型的遺傳性狀,這些都是研究相關基因的寶貴材料。近日央視新聞公布(CCTV.com,央視網 2017年12月28日):中國啟動“中國10萬人基因組計劃”,這是我國在人類基因組研究領域實施的首個重大國家計劃,也是目前世界最大規模的人類基因組計劃。科學家們希望通過繪制中國人精細基因組圖譜,來研究疾病健康和基因遺傳的關系。“中國10萬人基因組計劃”覆蓋地域包含中國主要地區,除漢族外,還將選擇人口數量在500 萬以上的壯族、回族等 9 個少數民族。計劃主要目標是研究中國人從健康到疾病是怎么轉化的,為中國的醫學研究或者是臨床診斷、治療疾病提供參考。哈爾濱工業大學計算機科學與技術學院生物信息科研團隊首席科學家王亞東教授介紹:該計劃將首次繪制中國人基因組變異圖譜,通過大數據的分析和比對,研究基因變異與環境和地域之間的關系以及這些變異相對應的潛在重大疾病隱患,繪制中國人多組學健康地圖,為疾病的預防和治療提供依據和支持。此項目將在 4 年內完成全部測序與分析任務。該項目研究將大大推動我國的精準醫學發展,促進臨床中針對患者和疾病及開展針對個體的精準治療。
2大數據帶來的臨床思維革命
2.1??? 制定臨床診治規范依據的變化??? 縱觀10余年來我們在制定婦科惡性腫瘤診治規范依據發生了巨大變化。臨床循證醫學研究(Evidence-based medicine)是求證醫學、實證醫學,即遵循證據的醫學。其定義是指慎重、準確和明智地應用當前所能獲得的最好的研究證據,結合醫生的個人專業技能和多年臨床經驗,考慮病人的價值和愿望,將三者完美地結合制定出適合病人的治療措施。依據來自患者的臨床利與弊,將結果分為不同級別,其中以A、B證據作為制定常規最有效的依據。之后隨著生物醫學發展,特別是隨著基因組學和蛋白質組學以及生物信息學發展,出現了轉化醫學(Translational medicine)。轉化醫學促進基礎醫學的研究成果向實際醫療應用轉化。將對基因與遺傳相關性的基礎研究盡快轉化到臨床中,其中最成功的就是對腫瘤的靶向治療(Targeted therapy)。隨著人類基因組學的研究,又提出了精準醫療(Precision Medicine),即通過基因檢測確診疾病;利用基因技術研制針對基因修復的靶向藥物,對疾病進行治療。并將個人基因、環境與生活習慣差異考慮在內進行疾病防治,從而增加疾病診斷治療的準確性。
通過對各種基因的廣泛研究,了解癌癥的遺傳形式有助于對腫瘤精確地治療。目前從識別最早的基因變化及其相關的表達突變蛋白,基于精確的癌癥預防是可能的。如對乳腺癌患者攜帶BRCA1/BRCA2突變導致了腫瘤發生,從多元的、基于精確的治療方法,即應用ADP-ribose聚合酶抑制劑成為腫瘤治療的常規。
2.2??? 從隨機抽樣研究到大數據全部數據分析處理??? 在現代科學研究中,人們主要是依賴抽樣數據、局部數據和片面數據,甚至在無法獲得實證數據的時候純粹依賴經驗、理論、假設和價值觀去發現未知領域的規律。因此,由于研究時采用數據的局部和片面,使人們對世界的認識往往是表面的、膚淺的、簡單的。大數據時代的來臨使人類第一次有機會和條件,在非常多的領域和深入的層次獲得和使用全面數據、完整數據和系統數據,可以深入探索現實世界的規律,獲取過去不可能獲取的知識和數據。大數據時代處理數據理念上的三大轉變:要全體不要抽樣,要效率不要絕對精確,要相關不要因果。大數據指不用隨機分析法(抽樣調查)這樣的捷徑,而采用所有數據進行分析處理。
2.3??? 從臨床隨機對照試驗到大數據的真實世界研究??? 臨床隨機對照試驗(RCT)作為最高等級的臨床證據標準,需要嚴格控制試驗條件,在可能有效的目標人群中進行標準化治療,樣本量小,隨訪時間短。
真實世界研究:利用真實世界研究的“真實世界證據”(Real WorldEvidence)取代傳統臨床試驗進行擴大適應證的研究。真實世界研究是起源于實用性的臨床試驗,屬于藥物流行病學的范疇。是基于臨床真實的情況采取的一種非隨機、開放性、不使用安慰劑的研究,因此其得出的結果具有很高的外部有效性。真實世界臨床研究特點是以臨床存在為依據,以數據為向導。真實世界研究的大數據來源非常廣泛,可以是患者在門診、住院、檢查、手術、藥房、可穿戴設備、社交媒體等多種渠道產生的海量數據。可納入復雜的、患有多種疾病的患者;可以非隨機的方式分配治療;所有遺傳密碼的信息都是大數據。真實世界研究是指研究數據來自真實的醫療環境,反映實際診療過程和真實條件下的患者健康狀況的研究。數據質量需要從多角度評價其質量的好懷,通過數據質量管理,提高臨床研究的水平和質量。隨著大數據在生命醫學的應用逐步擴大,將涉及到精準醫療、醫療決策、投資決策、醫學研究、健康管理、人工智能(Artificial Intelligence,AI)診斷等方面。
真實世界的研究,可在治療中根據患者的需求和臨床醫師治療策略變化,同時用多種措施;允許臨床醫師根據病情和患者全身狀況確定劑量,精確地滿足患者需要;可以設定更長的研究期限以測量干預措施的遠期效益和風險;可以包括更寬泛的指標,如功能指標,患者報告結局,成本效益指標等,使研究證據有更強的外推性,更具臨床實用價值。2016年12月,美國國會在官方網站上公布了《21世紀治愈法案》(21st Century Cures Act),提出真實世界研究數據的意義。
3大數據基因組學對癌癥治療影響
最近發表的來自柳葉刀腫瘤專業委員會的“未來美國癌癥領域研究的優先發展戰略”提出,我們正處于一場技術革命之中,大數據為人類生物學和癌癥提供了新的見解。在大數據時代,我們收集大量的信息,這些信息正在改變我們對待癌癥治療和預防的方式。目前從識別最早的基因變化及其相關的表達突變蛋白,基于精確的癌癥預防是可能的。大數據影響了對癌癥早期發現和預防,癌癥的遺傳學和表觀遺傳學,抗癌藥物的開發。最重要的是需要考慮人口科學,健康差異,包括癌癥的差異。癌癥患者的預后受種族、文化和社會經濟的影響。提出同樣重要的主題是數據共享,強調在研究中以病人為中心為優先權的重要性。
現在癌癥治療方法,約50%患者可以治愈,另50%盡管最終死于癌癥,但改善治療后,相當多的以往致命的癌癥,可以像慢性病一樣得到治療。在這種情況下,患者會遭受類似慢性疾病的折磨而影響生活質量。因此,將對癌癥的預防放入優先級別。
4大數據在婦產科領域中的應用
4.1??? 在真實世界中人乳頭瘤病毒(HPV)四價疫苗對宮頸高級別病變的保護效果??? HPV四價疫苗上市以后,對其有效性進行了長期觀察,得出了真實世界的保護效果。在澳大利亞,在19~22歲女性中,完成疫苗接種的人群比未接種人群的CIN2、3+發病率下降53% 。在丹麥,對在1993—1994年出生的女性中,接受疫苗接種的人群比未接種人群的CIN2、3+發病率下降73%。這兩個國家的真實世界數據證實了HPV疫苗對預防宮頸高級別病變具有很好的保護效果。
4.2??? 基因組學研究對子宮內膜漿液性癌的認識??? 子宮內膜癌分為Ⅰ、Ⅱ型已被廣泛接受,Ⅱ型子宮內膜癌以子宮內膜漿液性癌(ESC)為代表,雖然ESC僅占子宮內膜癌的10%~15%,但其惡性程度高,預后差。研究發現,子宮內膜腺體異型增生(EmGD)可能是ESC的癌前病變:ESC起源于子宮內膜中形態正常,而p53免疫反應陽性的子宮內膜細胞(p53印記),經EmGD階段后發展為子宮內膜上皮內癌(EIC),最終發展至侵襲性ESC。從形態學上可以識別的癌前病變為ESC的早期診斷和降低死亡率提供了可能。
在WHO 2014年的腫瘤新分類中,將EIC列入子宮內膜漿液性癌中。EIC具有高度侵襲性,診斷時33%~45%有子宮外轉移,故手術范圍按照卵巢癌腫瘤細胞減滅術進行。
4.3??? BRCA基因與卵巢癌??? BRCA是一種與卵巢癌相關的人體抑癌基因,一旦發生突變,機體就將喪失抑制腫瘤發生的功能,導致癌細胞大量繁殖。如果確定是攜帶BRCA1和BRCA2基因的遺傳性卵巢癌家族,則發生卵巢癌的機會增加到40%~50%。中國卵巢癌患者BRCA突變率為28.2%,其中BRCA1突變率22.5%,BRCA2突變率為5.6%。在高危家族中41%攜帶BRCA1或BRCA2基因致病性突變。而在散發的卵巢癌中,只有12.5%BRCA1或BRCA2基因致病性突變。在對中國乳腺癌患者的研究中發現,中國漢族人群中BRCA1和BRCA2基因突變攜帶者具有很高的乳腺癌發病風險。BRCA基因與異常的相關性導致了新的預防性戰略。PARP抑制劑是最引人注目的精確癌癥治療形式之一。PARP抑制劑被推薦用于所有對鉑類治療敏感的復發性卵巢癌患者的維持治療(無論是否攜帶BRCA突變),以及攜帶BRCA突變卵巢癌患者的三線以上治療。
5展望
當前醫療體系中醫生主要面對病人進行治療。大數據將會引起未來醫學模式發生變化。隨著精準醫學的發展、組學大數據的介入,使得任何人在沒有得病的時候,就能通過測出的其組學數據,分析組學大數據,對其未來健康發展的危險因素做出評估,并可以根據評估結果進行精準醫療適當干預,通過預防減少患病。由此,未來整個醫療健康體系的關口將會前移。可以說大數據、信息技術創新有望為醫療健康水平提升帶來新的動力,大數據將幫我們完成從治療到預防的跨越,大數據可以幫助我們帶來醫療的創新,幫助人們更好的了解疾病,預防疾病,更健康的生活。
大數據下如何重塑醫療的未來,如何創新使用大數據為未來醫療帶來巨大的想象空間,是我們值得思考的問題。大數據時代的醫療模式發生的變化,我們能跟上嗎?
參考文獻略。
來源:魏麗惠,探討大數據下的科研思路[J].中國實用婦科與產科雜志,2018,34(1):14-17。