在阿里天池醫療AI大賽第一賽季的榜單上,宜遠智能以0.806的分數排名第二,加州大學成績0.815占據鰲頭,北京大學以0.780的成績排名老三,清華、復旦、浙大、上交等國內高校以及GE、聯影等醫療器械商均參加了這項比賽。
意料之外Number 2的成績,讓CEO吳博信心大增,“我們原來以為肺結節智能篩查領域沒機會了,參與進來才知道,我們這些新兵還是有機會的。”對于今年4月份剛剛成立的宜遠智能來說,“這算是一次算法上的肯定,最主要的當然是算法實用性的體現”他說道。此外,與榜單上單打獨斗的選手不同,宜遠智能與香港浸會大學、南方醫科大學合作,共同參賽,相關模型在南方醫科大附屬醫院落地測試,“關鍵在于跨界融合”。
這種聯盟的思想不僅體現在比賽上,在公司主營業務方向上,也發揮得淋漓盡致。“本質上,我們就是畫一個圓,團結一切可以團結的力量,與不同醫院(醫生)進行科研合作。”
到目前為止,這家四個月的公司已經先后與香港大學深圳醫院、南方醫科大附屬醫院、復旦大學附屬中山醫院的科研團隊展開合作,項目已經涵蓋骨科智能診斷、皮膚病智能篩查、肺結節篩查領域,在具體合作細則上,公司負責模型,醫院/醫生負責臨床問題定位、數據標注解讀等。
“算法公司比數據公司值錢”
「算法還是數據,這是一個問題?」
關于算法還是數據孰輕孰重的問題,AI界爭論不休,在知乎上,署名為“項亮”的知友獲得最高贊同票,“我強烈同意數據比算法重要!雖然我們可以打官腔說這兩個同樣重要,但如果是一個資深的機器學習和數據挖掘研究人員,絕對不會掩飾他們對數據的渴望,當然對他們來說設計好的算法是很容易的,但好的數據卻是不容易拿到的。”而具體到AI醫療領域,相比于算法人才,數據也是更加稀缺和搶手的資源。
而從公司利益的角度,吳博給出的答案卻與此截然相反:“算法公司比數據公司值錢”。
今年年初的美國人工智能年會(AAAI-2017)上,Quora工程副總裁Xavier Amatriain曾表示,對于小公司而言,本身數據量就少,而獲得標記的數據更是需要額外的成本。小公司堆數據肯定是堆不過大公司,所以選擇把精力放在優化算法上往往比選擇把精力放在獲取數據上更高效。當然一方面小公司也需要不斷地積累數據。對此,吳博評說“深得我心!”
“畢竟醫療數據難以出現互聯網數據那樣中心化歸集的馬太效應,而像素級且冗余的醫學數據標注又需要極高的專業素養跟成本,算法才是我們最能發揮主觀能動性的部分。”他說道。
如果了解宜遠智能本身特質的話,會對吳博的觀點毫不意外。“我們評估后公司的優勢在于算法。”吳博稱,對于宜遠智能在阿里天池醫療大賽中的第二名成績,他告訴雷鋒網,很多隊伍的差別是千分位的差別,就算是0.001級別的FROC位置,都意味著至少20個疑似結節位置的判斷的正確。所以,你的FROC的指標比別人或者比自己能提升0.01的話,意味著幾百個疑似結節位置你做的更準了。這也是很現實的問題。“在我們看來,醫療沒有那么互聯網基因,互聯網企業是創業驅動的,智能醫療更多是研發驅動的,還是要把研發坐實。”
其算法優勢自然可以歸因到其創業團隊的背景上。吳博本科就讀于清華大學,曾任愛立信高級研究員、英國利茲大學博士后、香港浸會大學博士,合伙人劉凱是其同門師弟,香港浸會大學博士,曾為騰訊數據平臺高級算法工程師;另一個合伙人吳宇曾同為騰訊數據平臺AI算法工程師。吳博曾稱,“別的公司連一個AI模型人才都難求,我們連實習生都是伯克利、港科大、港大來頂尖深度學習好手,背后還有一大票教授、國家千人計劃的合作伙伴作為后盾。”
旗幟鮮明地打出“科研合作”的牌子
相比對算法的看重,在醫療數據的獲取上,吳博認為,或許沒有想象得那么難。甚至,“獲取”這件事本身,他認為或許也不成立,“ ‘占有’讓位于‘共享’是不可阻擋的趨勢,醫療數據也會如此。但共享的本質不是所有權共享,而是Access(訪問權/使用權)共享,我們對醫療數據也是不求所有,但求所用。”況且,他補充道,“數據本質上也是用戶或國家的。”
相比于數據,在吳博眼中,實打實的成果更重要一些。他認為,IP不僅在娛樂或游戲領域很重要,醫療領域也是很看重IP,更加IP驅動的。一個療法或產品一旦脫胎于學術成果,后續的產品落地和商業化,更加有生命力。
為此,宜遠智能旗幟鮮明地打出“科研服務/合作”牌子的公司,與不同的醫院/醫生尋求合作。“很多公司號稱在打造產品,落到實處就是是科研課題,這個走不了捷徑。”吳博告訴雷鋒網(公眾號:雷鋒網),“坦白了說,就是這種做法,最心安理得,我也不是不做產品,我們團隊的產品基因和經歷都很豐富,我們時刻把產品和平臺擺在心中重要位置,只不過,現階段以課題的形式切入。”
“我們團隊有學術背景,本身對學術有追求。針對前期的CADe,與擁有數據的醫院或科研談科研服務方面的合作,還是比較穩妥和保險的事情。”他說。
醫療數據非常稀缺,非常寶貴,為此,AI公司與醫院/醫生聯盟時,選擇權一般握在后者手中。廣東省人民醫院影像科劉再毅教授曾表示,在選擇AI公司時,會仔細斟酌:能不能以醫生為主導?團隊是否優秀?是否愿意配幾個人給我?無獨有偶,深圳市第二醫院影像科蒲主任曾稱,與AI公司合作時會考慮團隊素質,以及是不是以醫生為主導?這也是大多數醫生與工科團隊合作時的訴求。
對于誰來主導的問題,吳博表示,“科研合作醫生主導天經地義,但是不是要主導產業化,要看醫生是不是有‘企業家精神’,否則完全可以把專利授權給合作方。”
據公司合伙人劉凱博士介紹,公司的面部皮膚問題識別上已經“取得驚奇效果”,面向皮膚護理和敏感肌膚護理保養市場,“吸引了不少美容行業大公司談合作”。
能押多少資金,就能接多少活兒
在這種打法下,商業公司的“項目”變成了學術上的“課題”,雙方的投入與收益少了“銅臭味”,那么創業公司何以為繼呢?換言之,商業模式是什么?
早在今年3月成立公司前,吳博曾稱,“通過近期研究大量醫療醫藥上市公司,我發現牛的多靠布局,而不是單品打磨。”目前看來,宜遠智能確實未專注在某個單品上,而是畫一個圓,團結一切可以團結的力量,與不同醫院(醫生)進行科研合作。
他認為,通過與醫院合作,對某種疾病進行醫學影像智能分析,也許能獲得比目前任何人都要多的數據。通過將數據集中,他們可以很好地構建AI系統,你建造的東西要夠好,這樣才會讓你進入一個良性循環,可以隨著時間的推移積累更多數據,并繼續前進,最終做成一個與眾不同的小生意。
“ 像國外的Zebra、Enlitic等對標企業,也是多病種切入。有些機器學習算法是通用型的,你只需要使用不同的數據進行訓練都能快速得出解決方案,這也是為什么在今天機器學習被接納得如此之快的原因。”他說。
吳博告訴雷鋒網,總體上,公司的發展路徑是清晰的,就是從CADe(計算機輔助檢出)到CADx(計算機輔助診斷)再到CADp (計算機輔助預后)。現階段,以科研服務為切入點,相對來說,商業周期會慢一點,所以模型隊伍和商務隊伍有精力做多個領域,但仍是醫學領域的相關范疇。“我們把它分解成幾個子問題,分階段往前推進。”
著眼在資金上,目前公司的打法是:一方面落實融資;一方面與醫院形成合作提供服務。“融資方面穩步進行,目前已落實幾個來自有實力醫療集團的TS。其間還暫時謝絕了一些朋友的資金,因為對方不懂醫療和AI,教育成本高。”吳博說。
“我們做了這么久,發現沒有想象中的耗錢。”吳博告訴雷鋒網,畢竟跟醫院的合作有產學研三方,能分擔成本。他認為,本質上,未來醫療AI是toB的生意,精髓在于有多大本錢做多大生意,能押多少資金,就能接多少活兒,你有1倍的本錢,就能接到2倍的單子,其中可以賺取0.5倍的利潤。“toB的生意很好賺錢,以后多接點業務,讓營收增大一點。”
從長遠看,吳博表示,“將會嘗試不同方式,看行業內可能出現哪些收費模式,但toB業務,萬變不離其宗,做好服務,收益就上來了。”要么與硬件綁定,要么是獨立的軟件系統,可以嘗試不同的收費方式。他認為,醫療不同于互聯網產品,3~6個月就可以上線,估計到最后可以推廣的營收狀態需要1年半~2年時間,“但并不意味著全部在燒錢,toB的業務非要收錢,機會也很多。”
無論商業模式如何,最終離不開醫學和醫療的實質問題。“關鍵在于真正把醫學問題解決了,形成醫學IP,產品包裝、用戶體驗、性能等都好解決。”
“老舊方法做得不夠漂亮”
許多在AI醫療領域耕耘過一段時間的人,或多或少表現出一種迷茫,或者說悲觀的態度,甚至AI泡沫將要破滅的說法一度甚囂塵上。飛利浦大中華區臨床科學部高級總監周振宇表示,AI醫療與十幾年前一樣,關注點還停留在純粹數據驅動結果上,比如100個肺結節找到多少百分比,這對于臨床知識來說沒有太大的價值;科大訊飛智慧醫療事業部醫療影像產品負責人馬文君告訴雷鋒網,“如今的智能影像很像前幾年的互聯網醫療,大家一窩蜂進來了,但下一步怎么做,是個問題。”匯醫慧影表示,“整體來講,智能影像診斷真正深入到臨床診斷的很少,目前,業內嘗試與醫生合作做科研或提高效率方面嘗試,但要真正提高診斷率,目前還有很大差距。”
但吳博卻不以為然,對這一波AI突破充滿信心。他認為以前那些老舊的方法在醫學領域干得不夠漂亮,每一步做得不夠好,整個起來達不到大家預期。“以肺結節篩查為例,大家以為幾個大廠已經做到極致了,但至少從大賽結果上看,是新興公司做得更好。”
他認為,即使做單項的肺結節檢出,也能做到比較好的水準;檢查完了之后,分類、良惡性判斷等都有望逐個突破。每個環節準確率提高10%的話,整體而言,效果可能要好很多。
當然,他補充道,“我們現在還需要做出更多成績來,證明我們的想法是對的。”