為了推進數據整合和信息共享、發展以數據為基礎的醫療健康服務體系,11月28日至29日,“2015中國醫療健康大數據峰會”在北京召開,此次會議圍繞“開放、變革、發展”的主題,邀請主管部門、科研機構、醫療機構、優秀企業、市場研究機構等領導與專家、高層及800余位行業精英參與,深入探討科學推進醫療健康大數據的應用和價值挖掘、推動醫療健康大數據依法有序開放、醫療健康大數據互聯互通、數據標準與安全等醫療健康大數據相關熱點議題,為我國醫療健康的數據的發展提供前瞻的思想與觀點,為研究制定促進健康醫療大數據應用的政策和戰略獻計獻策。
在28日下午舉辦的醫療健康大數據應用與創新論壇上,NIVDIA行業業務拓展總監何猶卿作了題為《深度學習助力智慧醫療》的精彩演講,以下為演講實錄:
我分享這個熱門的話題,包括從互聯網行業,包括很多企業,包括智慧城市,都在強調人工智能。今天我們講人工智能核心的實驗方法,就是深度學習。
首先,什么是深度學習,什么是深度,什么是網絡。概念非常容易理解,我們人從出生以后,我們有大腦,大腦在接受外界的知識,在學習。只不過我們學習的曲線得多少年,大學畢業得20多歲,這樣的一個過程。今天我們教計算機也是這樣的過程,我們用兩個東西,一是神經網絡,來模擬人的大腦。用不同的數據樣本模擬外界對大那的刺激,教會他學習的樣本。訓練機器認知一些事物,達到機器像人的大腦一樣做一些智能化的工作。做語音識別、自然語言的理解、姿態、情感,包括行為推理等等。
用這樣的一套方法,或者說一套機制,來幫助機器達到人工智能目標,這套方法全世界用得最多的就是深度學習的方法。深度學習為什么能引爆人工智能的革命。
右邊的圖,原來在教會機器去認知很多目標的時候,讓它去識別語音,或識別圖片,我們用很多的聲學模型、像素模型,我們不斷讓機器達到識別目標的結果。一直以來,它的準確度上不去,準確度最高達到70%幾。真正深度神經網絡和深度學習的方法引入進來以后,把人工智能準確度推向一個非常高的臺階。突破80%,后來在2014、2015年又突破90%等等。一個智能化的應用要達到90%幾,這樣就接近于人們使用的習慣,也就是說這個產業可以得到普及的機會。
深度學習歸納了五個特點,一是準確度提高了。二是它對樣本的質量要求不是說那么敏感,比如說識別一張圖片,這張照片拍得好不好對它來說沒有太多的關系,因為我有太多的照片樣本,可以幫他實現協定。三是天性適合做運行計算。四是端對端的處理,我們需要了解中間的過程,只需要有一個輸入,它給我一個結果。用生物學習的方法來訓練他的深度網絡的模型,通過這個模型進行不同應用的變化。五是易于處理不同任務。我有一個訓練好的模型以后,可以用這個模型完成不同的任務。
深度學習在各個行業中有很多的實踐,包括以圖搜圖,目標識別,包括語音這類,還包括汽車自動駕駛,還包括今天的重點,在醫療健康這個領域,怎么樣用深度學生的方法幫助我們做醫療的輔助。
為什么它成為一個熱點,生物神經網絡不是新的話題,十多年前,二十多年前就有人做。用深度學習達到很好的方法,必須具備三個條件,一是得有足夠的數據教會機器怎么樣學習。二是得有一個非常正確的方法,有一個非常好的模型,神經網絡來幫助機器能夠得到正確的學習方法。三是有足夠的計算能力,以前GPU計算沒有大規模普及,今天是很好的機會。三個特點加起來,包括在企業和各個領域,用深度學習的方法學人工智能,成為一個非常熱門的熱點。
為了幫助識別率德國非常高的提升,要給他幾千萬的樣本,或上億的樣本。類似這樣大量的數據,必須得要求我們從技術手段上支持兩件事。一是數據必須得做運行計算,如果說做得太大,以后的種類太多,我得達到模型并行的目標做。做到一定結算是需要大規模人工智能應用的時候,會采用模型并行應用來做。
NVIDIA提供的GPU技術是重要的基石,第一臺谷歌大腦用1000臺GPU服務器做。2012年四暖的一些教學用12個GPU板卡,總共是三臺GPU服務器,里模擬做這樣的神經網絡的訓練,取得了同樣的效果。無論從投資的成本,包括從供電,包括從管理性等等,GPU對網絡學習得到了質的飛躍。神經網絡有幾個天然的特性,比如說并行計算,需要舉證計算的能力、高的數據帶寬等方面,這恰恰是GPU的特長。今天不管是全世界,中國,還是北美,他們做神經網絡的訓練基本上都是用GPU幫助解決。
NVIDIA除了提供GPU處理器,我們還提供完整學習的平臺。片子中綠顏色的都是提供的,第二行的工作。生物學習又要有數據基礎、又要有數學基礎,非常困難。NVIDIA做的一個軟件套件,本身大家降低深度學了困難度。從數據處理,包括深度神經網絡的配置,修煉過程的進展,包括每一層結果的可視化都提供了非常重要的方便。把時候全世界流行的神經網絡,都配置在里面,大家都可以選用。另外是把生物學習的框架都集成在里面。大家希望從事生物學習開發的工作,基本上用這樣的工具,經過兩天的培訓,基本上就能上路了,把困難度大大降低。
針對不同開遠的框架還做了加速,前面四個是做圖片的,最后LALDI是做語音的。經歷了這樣的時間段,從2015年開始,國內深度學習的熱潮都開始起來了。今天整個互聯網領域當中,比如說BAT,百度、阿里和騰訊,類似這樣的公司,從他們深度學習領域的開發,包括部署應用的層面看,不比北美的一些公司弱,基本上在同一個起跑線。也有一些科研機構,包括中科院,包括大學,也包括專門醫療的科研機構。他們也在嘗試用生物學習的方法,幫助他們做一些醫療影像,或醫療知識領域這樣的嘗試,這樣的研究。
每一個圖片右下角,哪些單位,和哪些大學,他們在做什么,進行研究。比如說檢測乳腺癌細胞的有絲分裂,新藥研發中的分子活動預測,新藥的毒性分析,基因突變引起的疾病防治,都用深度學習的方法進行嘗試。
這是美國加州的一個社區健康中心,用了深度學習的方法,美國加州這樣的地方,比如說他們也有少數民族,或者說沒有醫保的,類似于這樣的患者。而且從整體醫療水平的分布,也不見得是均衡的。有的地方可能很發達、有的地方可能稍微弱一些。尤其是沒有醫保的人,一般不敢進到大醫院,除非是說他有錢當然沒問題。在這個層面上,糖尿病引起視網膜的病變,引發人眼睛變瞎的病例,在美國也是非常高的。社區醫院用了非常簡單的辦法,和伯克利大學聯合做,也是基于那個框架做了一個方法。在社區健康中心中配備這樣的視網膜的拍照和檢測的設備,他們用深度學習的方法,用了大量的樣本訓練了模型。這個模型出來以后達到足夠的度,就把模型進行了移植,可以移植到筆記本上,非常像嵌入式的應用。人們只要去了拍攝視網膜的系統,進行一些拍照,這樣機器一般說就可以給他做一個分析。比如說他有沒有這樣的病變,做這樣的一個分析。整個的一套東西從事實起來,確實成本非常低。他用了一臺服務器,用了大量的數據,模型成熟以后部署在PC機上,就是一個筆記本電腦。這個筆記本電腦配合到視網膜的拍攝工具,就能夠幫助病人看他有沒有類似的病變。目前的設備中心在加州都進行了普及,給13萬人在提供服務。
伯克利幫他做模型訓練的時候,他要看我找多少樣本,教會這個機器學習,達到一定的準確性,提供給用戶來用。它可以直觀地觀測你的選擇進展,比如說我們拿不同的樣本教機器的時候,他們會告訴目前的模型會達到多少個準確率,會做這樣的分析。你還可以看得到每一層的,他訓練的一個結果。
國內我們引入一些合作伙伴的片子,這是阿爾茨海默AD的診斷,這是趙地(音)教授,保證和天壇醫院研究的一些東西。要把大腦的CT,或磁核的數據,來做成樣本數據。我們交給了深度神經網絡的模型,把這些數據不斷送給他。這樣的圖片是這樣的病癥,那樣的圖片是那樣的病癥,我就教給他。就把模型參數的調整,要形成一個模型,要么放在云端用,要么放在機器人做嵌入式應用。我們拿到這樣的影像,就這些影像作為輸入,輸入進去以后,這個模型基于規則就會給一個結果。這個結果就告訴我,這是正常的,還是不正常的,還是有懷疑的病理。
深度學習不僅僅是從醫療影像,還有關聯性的因素,比如說血壓、體溫、體重,都可以把關聯性因素結合起來,對一個病人做綜合的分析。這樣的方法,一是對我們的醫療做一些輔助,另外是幫助有些非常細微、非常小的特征,可能大夫一忙看不到,他也可以幫我們看整個的病理的情況,給醫療做輔助性的提示。
這是中科院和曙光公司做的,把胰島素圖片做清晰的紋理分析。原來我們要準備這樣多的胰島素的圖片,公共是230萬張,大概600多G,通過查檢做一些迭代計算,形成紋理,如果用單像GPU來做需要4.7年。去年他們用深度學習的方式,用GPU幫助他做處理,最后用紅色部的部分完成識別,就兩天就把模型數據訓練好了。
我們講細胞事件的檢測,通常我們要觀察一些細胞,加一些銀粉,就開始大量在顯微鏡上拍照片,照片一是不同的位置要拍照片,另外是不同的時間段,還要拍一些照片,在照片上發現一些有標識的現象。如果以前通過人工來做一些識別,來去找到這樣的現象,有拿100×100,10000張圖片來說,人工耗時需要35天。有一些很細微的變化,很容易是被肉眼遺漏的。
今天通過深度學習的模式,先對數據做標識,去訓練一個模型。以后我用中間的樣本,這個模型按我識別出來的變化,只是幾分鐘的事情,非常快,代替了過去我們通過肉眼做識別的工作。做細胞的分析,要做細胞的邊界。包括卷進模型,包括多層感知模型做,這個對整體的工作提升速度會非常快。通過一些樣本達到非常高的準確率,兩個不同的模型有不同的時間段,紅顏色單獨來描述。我用非常多的樣本訓練好這個模型,用GPU的平臺做需要兩天的時間就能完成。
今天上午也有老師在問,如果我們做一些嘗試有沒有辦法。今天我們的合作伙伴也跟我們一起來了,上海城函(音)電子科技,大家搭建了支持深度學習的云服務。不像阿里云那么大的平臺,是側重于醫療影像這樣的平臺。目前包括和中科院,包括一些醫院也做了一些,包括定位腫瘤邊界,包括手術后的風險評估,一些重要的健康檢測,這樣的一些工作。未來各位可以試試,它的平臺也可以幫助大家提供便利。我提交,他幫我反饋結果,可以去驗證。如果不夠,可以提供更多的樣本幫助模型做更好的識別。
深度學習未來在各個領域中有什么樣的機會,有什么樣的前景,為什么今天那么火熱。這是麥肯錫發布的,全世界有12個技術,這顛覆性的技術。生活,包括對科技的發展影響非常大,它做了一個排序。我摘出來幾個,一是知識工作自動化,里面包含什么樣的技術,可以用到什么樣的關鍵應用,在圖表中都有描述。
下一代的BAT一定從這樣的技術中,和從事這樣的工作技術開發的公司中來誕生。第二是先進機器人,或一般的機械手,把邏輯都設置好的機器人,是先進的機器人。比如說一個汽車可以做自動駕駛這樣的工作,這個工作核心的東西也是基于深度學習做的。簡單的一個導航,一個影像,一個雷達信號,不足以完成汽車自動駕駛。趕上斷路施工,豎個牌子,GPS可不知道。汽車得讀懂這個牌子,人家臨時斷路施工讓我繞行,就不要等了。還有和開越野車一樣,開車碰到臺階都躲了也不行,可能得循環到月球上。你得做一個判斷,我的車能不能過去,過得去就過,過不去再圍繞。
不管是這個行業從事保險,還是從事電信服務,還是從事獵頭服務,金融服務等等,都在不同層面地用智能化的一些機器,來幫從事更多的生產工作。
NVIDIA公司是積極的推進者,也是整個技術核心的技術提供者。后續希望大家可以繼續和課題和我進行探討。