• 首頁 > 2015中國醫療健康大數據峰會直播 > 楊志:海量數據為基礎的精神障礙研究方法學框

    楊志:海量數據為基礎的精神障礙研究方法學框

    為了推進數據整合和信息共享、發展以數據為基礎的醫療健康服務體系,11月28日至29日,“2015中國醫療健康大數據峰會”在北京召開,此次會議圍繞“開放、變革、發展”的主題,邀請主管部門、科研機構、醫療機構、優秀企業、市場研究機構等領導與專家、高層及800余位行業精英參與,深入探討科學推進醫療健康大數據的應用和價值挖掘、推動醫療健康大數據依法有序開放、醫療健康大數據互聯互通、數據標準與安全等醫療健康大數據相關熱點議題,為我國醫療健康的數據的發展提供前瞻的思想與觀點,為研究制定促進健康醫療大數據應用的政策和戰略獻計獻策。

    楊志:海量數據為基礎的精神障礙研究方法學框-智醫療網

    在28日下午舉辦的醫療健康大數據商業與價值論壇上,中科院心理研究所副研究員楊志作了題為《海量數據為基礎的精神障礙研究方法學框架》的精彩演講,以下為演講實錄:

    各位同事,大家好!很高興站在這兒,更高興的是我被安排在郭教授后面來講我們的工作,那是因為我們是剛才郭教授講的這些理念中的一個案例。我們做的是精神障礙的研究。

    把精神障礙放在醫療里面,它有一定的特殊性:1、它肯定是個慢病,跟剛才鄭教授講的是一樣的,并且是個致殘率很高的慢病。2、把它放在大數據主題下面,它的特殊性就是,它還很難定量化。因為,不管從精神障礙的診斷還是治療上講,我們現在都不如其它的領域、其它臨床的科室能夠更精確、更定量化,其實現在精神障礙的診斷還停留在醫生的主觀判斷上。同時也帶給我們一個機遇,如果我們從現在開始就用一些數據的思想改造它,那么它有可能要比其它傳統的分科進步的更快。

    神經影像,這是最近用來研究精神障礙,或者心理問題的一種非常有效的手段,或者說盡可能對它定量化的手段。

    但是,現在的精神影像研究存在這樣的問題,比如我現在開始研究抑郁癥和健康對照組,比照一下它們兩個在腦子的活動中有什么差異。可以看到很漂亮的一個圖,你說,如果你的腦的活動跟對照組之間有這樣的差異,那么提示你可能有抑郁癥的一些特征。

    但是,到了臨床醫生那里,臨床醫生不會看這種檢驗結果,為什么?因為臨床醫生說抑郁癥是我給你下的診斷結果,我不需要你再提供一個新的體征告訴我什么是抑郁癥。

    我又去研究另外一種癥狀,躁郁癥,現在的研究結果是,它們兩個的特征沒有太大的區別,這時候從術語上來講,這是個特異性的問題,從腦子活動所測量來的特征并沒有特異性,這樣就壞了,就沒有辦法診斷這個病。

    這是目前我們遇到的兩個困境。因此,大家都在想辦法,包括奧巴馬提出的“腦計劃”,其中的一個研究重點,就是我們要想辦法把現有的臨床診斷打破,因為現有的臨床診斷是基于病人在表面上表現出來的癥狀,而不是基于他的神經機制表現出來的。

    具體怎么做?沒人提出,還比較難,只是說我們要想辦法,從機制上做診斷,而不是從癥狀上做診斷。因此,我們就在想,我們是不是可以先不去按照癥狀下臨床診斷,而是采集大量的數據,還不能叫大數據。

    對于大數據我的理解,大家對大數據的定義可能不太一樣,我還不敢管我們所挖掘的數據叫做大數據。我很同意剛才陸教授所講的那件事,什么叫大數據?如果你把一個人各個方面的數據都定量化了,這是一個大數據,而并不僅僅是我的樣本量很大就叫大數據。但無論如何,對一個容量很大的數據也是這樣的,我們的理念不是為了檢驗某一個假設,為了回答一個問題,而收集一個大的數據。而更多的是,我們要從這個數據終提出假設,有了這個假設我們就有了更多新的看法,也就有了更多新的創新,沒有假設就沒有創新。

    所以,要從大量的數據終提出假設,而不是問題。如果從統計的角度來說,當你的樣本容量很大的時候,你會發現任何事情之間都有差別,你可以檢驗到任何事情之間的差異,這時候你檢驗到的差異叫做效益量很低,這時候在臨床實踐中一點用都沒有,這也是我說的大量數據不是回答單個問題的原因。

    當然,有了大量的數據,下一步就是從大量數據中發現這些假設。并且,不能把數據中的變異滬市掉,不管是在研究還是做各種統計的時候,我們傳統的思想是,我就吸收我的組內變異很小,而組間變異很大。我們在挖掘大數據的數據,其實更喜歡的是數據之間的個體變異,這樣才能找到是什么原因導致了這種個體變異。所以,提出了一個新的想法,或者一個新的方法框架,其實這是對心理學說的,因為我們所叫心理研究所嘛,對心理學也是這樣的,心理學的很多事情也是不定量化的。

    以前我們在做什么呢?以前我們從行為或者臨床表現上提出一些概念,比如記憶、情緒。當我們采集大量關于腦的數據的時候,我們就可以把這個研究方向反過去了。我先說腦的工作分成幾個系統,每個系統都跟我們的行為表現有什么關系。所以,大家看到箭頭的方向跟傳統方向是相反的。比如說,我可能找到了一個腦的工作系統,這個系統跟氣質、意志都有關系,所以這時候研究方向是基于腦的大量數據,來重塑心理學,或者重塑對精神學科的一些概念。

    接下來就是怎么實現,其實就兩個要素:一個叫數據,另外個叫挖掘。數據里面,包括大規模的大數據采集方案,具體在臨床上怎么能采到。然后有了數據怎么去管理,怎么去做自動化預處理,這實際上是跟剛才前半段阿里的那位女士所講的有關系。然后,從數據挖掘的角度上來說,有數據去算法和個體化運算模型,等等,還可以做很多事情。

    如果從數據的角度上說,這是我們目前在上海所用的一套流程模式圖,現在在上海精神衛生中心,基本上每來一個病人都要采集他的影像數據、血樣數據等等,并且影像數據是包括多個模態的,還要對這些數據進行追蹤。

    構造了一套這樣的系統,實際上這有點兒像一個小云,但沒有那么大規模。我們可以有好多個掃描儀和采集數據的站點,包括北京、上海心理學我們有很多臺磁共振掃描儀,在上海也有。形成數據庫,在神經影像領域的共享現在可能是比較開放的,大家都很樂意把自己拿到的數據共享給大家,待會兒大家會看到已經向全世界共享了上萬個人的數據了。包括,我們用一些高性能計算機,包括中科院的高性能計算系統,進行的圖象處理和智能控制。

    這是一個例子,數據庫里面自帶一套質量控制和預處理的系統,這套系統對于研究人員,如果不關心處理細節,直接去下載得到的結果,比如我想知道腦子負責語言的這個區域皮層厚度有多少,這時候直接從數據庫中下載就可以了。

    這時候,病人和正常人的數據,直接下載下來去做統計分析就可以了,這實際跟剛才郭教授講的是一樣的。從臨床數據的采集到最后纂寫論文,到最后形成科研成果,只需要簡單的幾步。這是我們研發的一個處理系統,基本上是分三個層級,分別對數據進行不同的數據。

    現在,我們已經有一個關于數據的文章了,這些共享的數據已經在重要媒體上發表了,這些數據也引起了世界很多人的關注。從挖掘上來看,根據我剛才所說的理念,我們實際是想從病人的神經影像數據終先生成假設而不是先下定論你是抑郁癥,而不是說你的腦的活動有什么特征,我們也提出了一個相應的算法。

    比如說,我們像做Google搜索一樣,Google搜索你搜索的是網頁,網頁是什么?實際就是那些關健詞,但是我們這里搜索的是病人的神經影像特征,有這樣一套算法,可以自動的根據神經影像特征,獲得某個群體的特征。

    我再根據這些詞之間的關系,把這個群體找出來,如果你把每個詞當做一個病人的話,就可以實現,根據他們腦的活動特征分成不同的群體。

    這是一個簡單的例子,有一類病人叫做早發性精神分裂癥,可能有些人在18歲以前就出現了精神分裂癥的癥狀,但這些人跟成年人得精神分裂癥的癥狀不一樣,到底是怎么回事?沒有一個定論的方法,實際我們可以根據某個腦功能網絡的活動,可以形成這樣一個群,這里面既有正常的孩子,也有得病的孩子。但是,與正常孩子集合在一個群里的病人,有一個重要的特征,病人怎么跟正常人混在一起去了?而另外一些病人散在周圍?后來我們發現,凡是被紅點標的人,有點點細微的區別,他們的腦功能上實際是不一樣的。這兩位病人,雖然名字一樣,但腦功能網絡上這類人跟正常的孩子沒有區別,而這類人跟正常的孩子有區別。這就是從腦活動中發現新的假設,也許這類人不應該叫做這樣的名字,而應該叫做某一個系統,綠三角這類人是另外一類人,這是一個新的亞型。

    最后,感謝同事們,謝謝大家!

    標簽:醫療大數據智慧醫療遠程醫療健康大數據移動醫療

    發表評論

  • 野花视频