用人工智能(AI)將一家創業公司與其它企業區別開來的日子已經過去了。如今,如果一家科技公司沒有使用一些機器學習技術的話,是很難吸引風險投資或找到合作伙伴的。但是,對于試圖運用AI進行醫健創新的公司,它們面對的風險依舊很高。在醫療產業,錯誤的算法意味著生與死的差異,因此圍繞流行科技的炒作在這里比其他行業將遭受更嚴苛的考驗。
過去五年中,美國采用人工智能的數字醫療公司數量急劇增加。2017年,CBInsights跟蹤了逾100個以AI為重點的醫療公司,并注意到自2015年1月以來,其中有50家公司已完成了首輪對外融資。該領域的融資事件從2012年的不足20起增長到到2016年的近70起。這些公司的AI技術在醫療領域涉及的運用包括影像診斷、遠程患者監控、藥品開發、腫瘤研究等。一些主要的AI科技公司,像Ayasdi(曾基于拓撲學數據分析建立了一個機器智能平臺),還有很多新興AI公司,如H2O和DigitalReasoningSystems,都投身于醫療領域。該領域因此也吸引了包括KhoslaVentures和DataCollective在內的頂級風險投資公司的目光。
????106家醫療保健領域的新興AI科技公司(來源:CBInsights)
最近的一項調查還發現,超過半數的醫院計劃在五年內引入人工智能,其中35%計劃在兩年內完成該目標。在波士頓,PartnersHealthCare剛剛宣布與GEHealthcare進行為期十年的合作,將深度學習技術整合到自己的網絡中。AI的應用將不僅僅局限于改進臨床醫生的工作流程和更快地處理用戶反饋。
在醫院接受調研的美國醫生們認為,AI技術可能對人口健康、臨床決策支持、診斷工具和精密醫學的影響最大。此外,AI可以幫助藥物開發、臨床試驗等都變得更快、更便宜準確。
我們怎么達到目標?
但美國媒體指出,把所有的信念都傾注到AI上的時代還沒有來臨。RoamAnalytics首席科學家兼聯合創始人AndrewMaas表示:“人類大腦的前景非常強大”;“計算機的評估能力是強大的,但它的水平還不足以得到我們的信任。”
所以,我們什么時候才能看到醫療產業通過機器學習實現轉型呢?近來,我們在最簡單的應用和最復雜的診斷任務上都能看到這種技術的身影,它既可以自然語言處理或圖像識別的形式出現,又能做到用強大的算法處理幾十年醫學研究積累的數據庫。但是,AI如果不能戰勝一系列額外的挑戰,比如監管障礙,與傳統醫院IT系統的兼容性,以及在獲得關鍵醫療數據方面的嚴格限制,AI是不能成功進入醫療領域的。但是,謹慎并不意味著人們應該停止創新,數字健康的利益相關者意識到,想要全面挖掘AI的真正潛力,他們還需要戰略合作伙伴,以及對統計數據的清醒認識。
盡管挑戰很多,但各家創新企業在醫療AI領域絲毫不敢怠慢。例如,Google于近期宣布,已將其經過試驗和真實用戶測試的機器學習能力引入醫療領域。該公司的研究團隊谷歌大腦(GoogleBrain)與加州大學舊金山分校、斯坦福大學一起,收集了數百萬患者隱去身份后的醫療大數據。
不僅如此,谷歌CEO桑達爾.皮查(SundarPichai)本月在GoogleI/O開發者論壇上說,2016年谷歌推出了Tensor計算中心,并把它描述為一個以AI為基礎的大數據中心。
“Google將所有的人工智能力量都納入了Google.ai,”皮查說,“Google.ai將重點關注三個方面:研究、工具和基礎設施,還有應用型AI。”
2016年11月,Google研究人員在JAMA發表論文稱,Google建立在大量眼底圖像訓練基礎上的深入學習算法,能以90%以上的準確度檢測出糖尿病性視網膜病變。皮查說,他們正在努力將AI應用到病理學上。
“這涉及到處理大量數據的問題,機器學習具有獨一無二的解決這個問題的能力,”他說,“所以我們建立了神經網絡,檢測癌癥擴散到相鄰的淋巴結上的癥狀。雖然還處于早期階段,但我們的神經網絡表現非常好,有高達89%的精確度。其中有很多假陽性的結果,我們請教了相關病理學家,他們可以改善機器的診斷能力。”
蘋果公司則是在最近收購AI公司Lattice,該公司曾開發了一套用于醫療的算法。
微軟也在進入這個領域,幾個月前推出了醫療NExT計劃,將人工智能、云計算、研究和行業合作伙伴關系融合在一起。該計劃包括基因組學分析和健康聊天技術,并與匹茲堡大學醫學中心建立了合作伙伴關系。
我們在很多創業公司那里看到了各式各樣的AI,從Ginger.io的行為健康監測和分析平臺,即Sensely虛擬助理,到Ava公司的應用程序和可穿戴設備,還有Clue能夠預測不能生育年齡的技術。除此之外,還有最近創建的BuoyHealth,它設計了一種醫療專用的搜索引擎。Buoy的數據來自超過18,000份臨床論文,涵蓋500萬患者,囊括1700種癥狀。除了癥狀檢查之外,Buoy首先詢問你的年齡、性別和癥狀,然后針對性地詢問下一個更詳細的問題。大約兩三分鐘之后,問題會越縮越小,情況也越來越細致。最后它能夠為用戶提供潛在癥狀列表,以及患者下一步的選擇。
另一個很有前景的領域是醫學影像。2016年11月,以色列的AI影像分析公司ZebraMedicalVision宣布推出新平臺。這個平臺允許人們通過互聯網從任何地方上傳和接收他們的醫療影像分析。Zebra于2014年建立,目的是讓電腦自動分析醫學影像,診斷包括骨骼健康和心血管疾病在內的各種疾病。該公司已經穩步建立了一個影像數據庫,結合深入學習技術,算法來自動檢測和診斷病癥。另一家推出同類產品的以色列公司是AiDoc,該公司剛籌得700萬美元。
但無論技術公司的規模和功能如何強大,患者數據可及性的問題使算法在診斷或預測方面取得的成績與人們的理想仍有差距。這就是為什么那么多公司還處于實驗階段。
風險投資公司8VC的首席執行官JoeLonsdale說:“最難的一點在于一開始就能擁有數據。”
加州大學伯克利分校公共衛生學院生物統計學教授MayaPeterson博士則表達了更加冷靜的觀點。她表示:“現實世界中,數據之間的關系很復雜,而且我們還沒能完全理解它們。機器學習在某種程度上過于雄心勃勃,我們卻還要去研究更加復雜的問題。這并不樂觀。”
好的算法難以構建
機器只能從為其提供的數據中學習,所以研究人員,工程師和企業家都在忙于為機器提供更大、更高質量的數據庫。
上個月,谷歌母公司Alphabet旗下的Verily啟動了ProjectBaseline研究,與斯坦福大學醫學院和杜克大學醫學院合作,收集了大量表型健康數據,以期制定出一套明確的人類健康參考標準。ProjectBaseline旨在收集來自約10,000名參與者的健康數據,每個參與者將被追蹤四年。這些數據將被用來制定人類健康的“基線”圖,深入了解健康向疾病的轉變過程。獲得的數據將以多種形式呈現,包括臨床數據、影像數據、自我報告及行為數據,以及從傳感器和生物樣本上獲得的數據。該研究的數據存儲庫會建立在谷歌計算基礎架構上,并安置在谷歌云平臺上。
“政府如果能夠進行數據質量管理和數據共享,就會帶來很大改變,”RoamAnalytics(一家位于舊金山的機器學習分析平臺提供商,專注于生命科學)的首席科學家AndrewMaas說。“私人企業想這樣做,并愿意收集大量數據,那很好。如果給我們這些數據,我們能夠在一年里做出驚人的結果。但是,如果因為人們的擔憂而導致數據無法收集,我們什么都做不了。”
患者數據的可及性和計算能力是理想與現實之間存在差距的重要原因。IBM沃森通過眾多合作伙伴關系積累了大量數據,輸入其所謂能夠更深入理解患者健康狀況的認知計算模型。由于實際結果尚未完全呈現,輿論對IBM沃森的看法趨向兩極。有人覺得這算得上是機器學習的鼻祖。
斯坦福大學語言學和計算機科學系的主任ChrisPotts和RoamAnalytics的首席科學家稱,沃森“可以說是醫療保健領域最有希望的企業”。其他人對此卻不怎么有信心——SocialCapital的CEOChamathPalihapitiya稱沃森為“一個笑話”。
這種不確定性似乎并沒有阻礙沃森發展新的合作伙伴。就在本月,沃森加入了MAPHealthManagement,把他們的機器學習技術用于治療藥物濫用。IBM研究部門正與SutterHealth合作,以未充分利用的EHR數據為基礎,開發預測心力衰竭的方法。
IBM沃森從2011年開始這個項目,當時這臺機器贏了Jeopardy游戲,使公司對這項技術用于實踐充滿信心。
“我們必須教導它醫療領域的相關技術,這些技術相當復雜,它們根據專業的不同而變化,而且在世界的每個地方都不一樣。我們必須讓系統習得醫學用語。”沃森健康副總裁兼首席策略官ShivaKumar說,“第一步是自然語言處理的能力,比如在參與對話時能給出最好的回答。接著就是培養與病人對話的能力,讓它進一步吸收知識,不斷向前發展。”
Kalsar還解釋說,為了做到這一點,IBM沃森必須解決非結構化數據的問題,“我們打算使用詞匯認知計算,因為它不僅僅局限于機器學習和深度學習,還能夠整合學習,洞察更深刻的東西。”
“醫療產業是獨一無二的:它受到高度監管,還有大量不能使用的數據。當然同時也有很多未開發的資源,”他說,“所以,這是一片很多技術都可以一展拳腳的領域。但到最后,治療的成功與否仍舊掌握在醫生手里。”
如何前進
許多專家預測,AI能夠在醫療領域掀起波瀾。
AllscriptsAnalytics的首席醫療官FatimaParuk博士認為,AI將首先應用于慢病管理;隨著以患者為中心的健康數據的可用性越來越高,以及環境和社會經濟因素的發展,AI也會跟著進一步發展;最后,基因信息會融入,使精準醫學變成現實。
AI能夠對那些在技術上早已非常落后的制藥公司產生巨大影響。這些制藥公司如今也開始尋求改變了。LuxCapital的合伙人,輝瑞公司的前董事長兼首席執行官JeffKindler將制藥公司稱為“創新者困境的典型代表”,因為他們從未遭受過嚴重的財務危機,因此也沒有動力轉變商業模式。但是,AI發展的速度和潛力巨大,制藥公司也無法拒絕其吸引力,這些醫藥領域的利益相關者需要更多的溝通,來了解到底怎樣運用AI。
效率是藥物開發的關鍵,特別是對于那些正卡在FDA的創新企業來說,他們可能會讓AI的能力變得更強大。輝瑞負責數字戰略與數據創新的副總裁JudySewards表示:“我在一個需要花12年才能推出一種新產品的行業工作,12年相當于三個總統任期,或者說三屆世界杯的時間。在那段時間里,1600名科學家需要著手研究,進行3600次涉及數千名患者的臨床試驗。我們考慮的是AI能不能加快這一進程,使其更智能化,將突破性藥物與相應的患者需求連接起來?”
Sewards表示,“使這樣的設想成為現實”正是他們與IBM沃森進行免疫學研究的目的,“有些人擔心機器或AI會替代科學家和醫生,但實際上它們更像是研究助理或者幫手。”
德勤醫療負責人RajeevRonanki說,只有三股強大力量的結合,才能推動機器學習向前發展,這三股力量是:數據的指數級增長,更快速的分布式系統,和更智能的能夠處理和理解數據的算法。當這三股力量結合在一起時,Ronanki預測,CIO可以收獲一些認知方面的洞見,以強化人類決策的能力,提高基于AI的參與工具性能,以及設備和流程中的AI自動化水平,提升領域相關的專業能力。他引用一段IDC報告的內容,稱:“我們認為這種增長將會持續,預計在機器智能方面的投入將增加到313億美元。”
“今天我們所處的位置基本是零,”RoamAnalytics的首席執行官兼共同創始人AlexTurkeltaub表示,“我們多多少少想出了一些商業途徑,最多只能使用碩士生水平的統計數據。因為要把數據放在一起并同時要處理監管問題是非常困難的。大多數最前沿的深入學習算法是在60年代開發,而它們的想法又來自于16世紀。我們必須找出更好的方法。”
就像輝瑞公司的JudySewards所指出的:“在這個行業,你必需有百分之百的確定性,因為一旦犯錯,有些患者可能就要為此付出生命。”