主持人姜梅:
感謝張錦景先生。這種實時在線監控確實是挽救了很多人的生命,也是非常有意義的。剛才所到通過早期篩查和早期干預和康復式預防這個鏈條下來以后,挽救了這么多的生命,從07年到現在已經非常成熟了,再一次掌聲感謝!第七位報告者是李海花女士,來自工信部電信研究院通訊研究所副總工程師。她給大家演講的主題是“大數據技術與醫療健康服務” 有請!
李海花:
大家上午好,非常感謝中國通訊學會邀請我們參加這個論壇,也非常高興有這個機會跟大家交流一下大數據和醫療健康這兩個領域最新的進展。我是來自信息通訊研究醫院,原來是工信部電信研究院,現在我們院已經更為新的名字以后,也是希望能夠拓展,因為ICT服務的領域越來越廣,而且向滲透,我們中國信息中心也是希望更好跟業界之間提供支撐和服務。我參加了四月份移動健康論壇的活動,我今天的主題是大數據和醫療健康。首先是大數據,我們這個概念數據本身出現了多年了,我們50年就有數據庫,90年的時候就有相應數據的挖掘和相關智能的應用,大數據發展,互聯網的發展跟大數據發展密不可分的,2000年易于海量數據搜索引擎發展非常快,06年電商的廣告和社交網絡紛紛利用大數據的技術來提升他們的服務,使用大數據概念出現的時間不長,這種概念提出在2011年,這個技術的跨越發展,是分布式的存儲、分析和處理,現在隨著大家越來越意識到大數據的本身的價值可能帶來的增值的服務,現在領域也是不斷擴展。大數據在業界沒有對它有明確的定義。我們現在對大數據的認識,我們很早以前在去年我們院提出大數據三維特征,一個是體量很大,另外是多樣性的,特別是進入不同領域,它有圖像、視頻、文件大小關聯性也不太一樣,另外大數據還強調實效性,進行實時的分析和處理的結果,除了大數據本身的特性之外,大數據應用理念也在發生一些變化,原來我們數據分析完了有一個結果就行了,現在從開環走向了閉環,我數據分析的結果要反饋到流程優化方面的,馬上形成閉環對我政府流程進行優化。另外數據分析的范圍原來是抽樣的,現在是整個觀念性的分析。另外大數據工具也在發生變化。大數據從技術角度來說,我們分成了五個層面;一個是數據的導入,或者采集完的數據來自互聯網,我們進行加工。
第二個加工完數據以后我們要存儲,還有計算、處理、分析,我們最后數據要有可視化,因為數據單條是看不出來的,要有可視化的分析,這塊我們可以看到這塊的核心目前來看是海量的存儲技術和計算的技術和分析的技術,三個層次技術的解決重點是不太一樣的,存儲是海量多樣性的,結構化和非結構化能夠優化的存儲,另外在計算環節要針對海量的數據,而且可以看到不同的技術,交互式的技術和流處理的技術,我們怎么好好分析。
另外在數據的處理之上我們針對數據的分析,跟我們商業智能結合起來,這個是大數據整個的技術體系,現在大數據本身的技術也是我們在醫療行業用到大數據,現在都有一些新的方向,這種數據預處理,目前主要解決的問題是多元化的,和數據可用性,多元以后數據的集成和外部化的數據,不光是物聯網,很多系統在引用外部化的數據,外部化數據的識別等,另外加一些標注,這樣更利于它的預處理!還有在存儲層面有新的技術,有低成本超大能量的問題,現在一些新的技術像分布式數據庫、接口和查詢語言有很多技術出來,發展趨勢還有流化等出局存儲。
大數據這塊有一些成熟的平臺,像Hadoop有一些基于內存的技術發展,分析這塊強調的是自主的自動的分析方向的發展,可視化有人機交互的趨勢。這個是大數據整體的情況。大數據應用我們分成幾個方面;一個是互聯網方面,我國互聯網發展非常快,這塊跟國際是基本同步的,我們在搜索、廣告、個性化推薦和互聯網金融這些方面有很多的應用,國內互聯網企業也有很多應用,另外使用大數據除了醫療有疾病監控,疾病分析、藥品、零售、金融和政府這些領域發展。另外大數據這塊不光限制在服務的領域,另外跟實體的經濟也在結合,像制造業,現在一個很熱點的方向就是智能制造,美國歐洲都在推這個,這個核心是大數據和工業的設計,一些產品的制造,跟消費者怎么很好的結合制造我的產品?實現個性化產品的制造。這方面也是很重要的領域。
大數據應用也面臨一些問題,我們數據很多公司都有,現在隨著可穿戴技術的發展,和智能設備發展,很多公司都搜集了很多數據,一個大挑戰不知道如何從大數據獲取價值,這是2013年調查報告,大數據應用中的企業障礙,另外整個企業的大數據戰略也是非常關鍵的,另外我們技術方面和人才方面的支撐也是很關鍵的;另外如何整合?我們企業做的包括醫療這塊,健康的、醫院的、有病人的,住院信息、門診信息,和結構等都是重要方面。這是面臨的主要挑戰。
另外,從數據資源來看,我們國家和國外還有一些差距,這個左邊可以看到是直觀的對比,中國和美國數據存儲量,主要對比了三個主要的行業,金融、交通、醫療,我們比較起來涉及到不同國家信息化的程度,中國我們信息化跟發達國家比是稍微落后一些的,這種大數據的儲量跟發達國家比較起來是有很大的差距的。另外,數據孤島問題也是重要的方面,現在我們醫院有很多數據,有一些體檢的,像慈銘有一些數據,新興的企業也有一些數據,實際是信息孤島沒有打通!分到不同的信息系統,這塊數據將來有統一的標準推動也是很重要的方面。
大數據是對我們現有的制度也會產生很大的挑戰,現在數據搜集在很多時候是用戶不知情的情況下搜集,這個大家也是感同身受了。特別在現在互聯網發展的終端另外個人數據,對個人數據隱私保護,你可能關注的是表情、行為,有的關注的是交易,很多企業有了數據,但是實際怎么去用?也在摸索。所以這塊也有很多的問題,實際在推進數據增值服務的時候才能看到,另外數據的用戶不光是用戶的主體,而且也會參與到用戶的使用。現在國際上發展比較快的是創客,用戶眾籌的方式,有些網站國外已經出現了,眾籌的方式提供一些數據。這種數據我們在使用的時候還有一些界定,屬于個人的還是屬于企業?這塊對我們政策都是有很多新的挑戰,這個也要思考。另外大數據產業,我們整體分成了四個方面;一個是大數據解決方案和運營商,大數據處理服務提供商和數據資源提供商,這塊有不同的理念有一些細節的劃分。有在線純分析服務的,離線純分析服務。現在圍繞大數據整個產業發展是非常快的,國內包括國際上很大的生態在發展。
現在新的發展大家可以去關注,在座很多企業都擁有數據,因為大數據的價值,我們有人把大數據比作石油,是重要的戰略性資源,大數據作為資源的提供商,這塊數據能夠產生價值,它是有價的,大數據交易市場已經開始出現了,國外向政府推動建立了平臺,它有一些平臺開始有了數據的交易,像中關村咱們國內很多地方都在試圖研究大數據,促進數據的增值或者數據資源的挖掘!國內的話,中關村已經成立了大數據產業連盟和交易產業連盟,這個連盟也是在制訂一些交易的辦法和規范,這樣的話對數據的增值非常的關鍵,這塊還有很多大數據交易的規則,因為它涉及到法規法規和很多方面。
目前大數據是我們分成三個階段,大數據0.1和2.0,目前大數據帶來一個相對的數據,2011年提出來到現在大家發展很快,大家也非常重視這塊,從目前來看是比較初的階段。將來到1.0的時候會形成數據的市場化的東西,不光是數據在企業內部分析和處理,還要在外部看應用和融合。到2.0是很多法規和技術更加完善。當時協會跟我溝通的時候希望介紹一點標準,因為我們院做標準研究,現在大數據標準化是一個問題,涉及到軟件的標準,所以它的標準化是一個難點,我們醫院建立這些平臺在討論標準化,這是我們認為的標準化體系,采集、存儲、開放和管理、性能等標準,存儲處理這塊要不要定標準挑戰更大一些,這個是整個標準化體系。目前對大數據的研究,大數據在國際上它的標準化也是很重要的方面,總體來看涉及到很多標準阻止,ITU、OTC這些組織,大家參與標準化的比較清楚。實際現在大數據標準化在大數據的利用和開放和整個系統集成是非常關鍵的方面。國內這塊我們主要是標準化協會做標準化,這塊可以看到大數據的標準,包括它的安全、開放接口和運維的標準。
回到醫療這塊,大數據用途非常廣泛,醫療這塊大數據也是大數據應用非常重要的領域,有專門針對醫療數據的數據池,分析藥物的,診療的,用戶的行為和藥品的教務價格的信息,醫療大數據很多專家都講了涉及到很多方面,包括我們心臟的身心等很多方面,大數據應用給醫療這塊有很多想象的空間,包括臨床的數據,這塊有不同數據的內容,和實時統計分析,包括衛生方面,還有遠程病人的分析,包括心臟監測,還有人口統計等分析,另外就診行為、藥品研發和新農合基金數據分析和新的服務模式。目前,醫療這塊大數據醫療健康領域也展開了,電子醫療國際標準也在定義開放接口,這塊有一些新的進展,包括平臺層面的能力和整體架構,另外GSMA利用移動網支撐醫療機構的分析,國際上很多組織包括HL7這塊醫院用的比較多,很多醫療領域都在用,標準都比較復雜的,我們國標層面因為我們做信息通信,我們從信息通信這個角度做標準,智慧醫療和移動醫療框架及總體要求,另外CCSATC也在做醫療標準,一開始標準這塊走向國家有國家標準,行業標準和地方標準,這個很實質的標準設備要求、采集等標準我們跟重慶一塊做地標,先試先行,慢慢推進。這是國內的情況。
互聯網醫療健康大數據涉及到參與的產業很多,現在互聯網三大互聯網公司騰訊、阿里、百度都在往醫療健康領域滲透,一個是現金流豐富,另外可以通過在線服務拿到很多數據有一些增值服務。很多企業都會涉及到擁有大數據,這個是很多企業都參與的。我們也跟企業去交流,一些地方已經建了醫療的平臺和遠程醫療平臺或者監測平臺,這都是在民營企業手里,除了政府、事業單位和醫療本身,保險也在參與,利用醫療健康做保險的個性化的保險的分析。首先產業比較多,另外現在大數據醫療健康領域數據的開放已經也是趨勢了,美國在今年食品、藥品管理局就推動了醫療健康數據的開放,先導有一個網站,先導的項目把300萬份藥物不良反應報告放到網上去。另外大數據我們需要考慮的幾個方面,推進數據開放,開放的需求,利用醫療數據增值服務是很重要的方向,我們針對法規和數據的主體之間界定擁有者和使用者,權限范圍都是很關鍵的方面。 技術上,數據開放API,數據隱私保護及去隱私技術等。民營企業大數據經營資質,這塊資質也是很重要的方面,是后續需要考慮的方向。從數據角度還有很多工作要做,這是我今天大概跟大家交流的內容,謝謝大家!