2020年開年之際,新型冠狀病毒感染的肺炎疫情洶涌而至。相比于2003年的SARS疫情,十余年間,新一代信息技術迅猛發展,人類社會已進入大數據時代。面對新型冠狀病毒感染的肺炎威脅,大數據這一技術手段可提供重要幫助,城市管理者也在新型智慧城市建設的過程中獲取了很多疫情防控和城市管理的經驗。
面對緊急突發的公共衛生事件及多方來源的海量數據,如何聯合政企單位科學運用大數據技術,為公眾提供更完整、連續、準確、及時的防疫信息,為專家提供追溯疾病源頭的方法,為決策者提供傳染病發展的趨勢,是大數據應用于防疫的三大重要任務。
可分析“涉疫”人員流動軌跡通過集成電信運營商、互聯網公司、交通部門等單位的信息,大數據可以分析出人員流動軌跡。具體來說,利用數據分析、數據挖掘等技術,一方面可以通過手機信令等包含地理位置和時間戳信息的數據分析繪制病患的行動軌跡;另一方面,根據病患確診日期前一段時間的行動軌跡和同行時間較長的伴隨人員,大數據可以推斷出病患密切接觸者。綜合分析確診病患、疑似病患和相關接觸者的行動軌跡,可以準確刻畫跨地域漫入、漫出的不同類別人員的流動情況,這既為精準施治提供了有力指導,也為預測高危地區和潛在高危地區提供了有力依據。
可追溯傳染病源頭利用人工智能、深度學習等新興技術,聯合出行軌跡流動信息、社交信息、消費數據、暴露接觸史等大量數據進行科學建模,可以根據病患確診順序和密切接觸人員等信息定位時空碰撞點,進而有望推算出疾病傳播路徑,為傳染病溯源分析提供理論依據。
可預測疫情發展態勢通過高危人群,即確診病患和病患密切接觸者的運動情況,結合疫情新增確診、疑似、死亡、治愈的病例數,借助傳播動力學模型、動態感染模型、回歸模型等大數據模型和技術,不僅可以分析展示發病熱力分布和密切接觸者的風險熱力分布,還可以預測疫情峰值拐點等重要信息。根據預測的疫情發展態勢,衛生部門可以針對發病熱力分布,對重點區域強化衛生措施;依據風險熱力分布,對可能擴散的區域提前陳設防疫防控資源,避免出現二次爆發、局部爆發和多點爆發。同時,疫情發展趨勢預測對于政府部門確定復工時間、出臺公共管理和促進經濟發展的措施都將起到很重要的作用。無論對決策者還是普通人,心中有“數”,才能提前陳設,防患未然。
數據采集手段及流傳仍存問題
雖然大數據在精準防疫和決策支持方面可以發揮重大作用,但從我國此次應對新型冠狀病毒感染的肺炎疫情來看,仍有很大空間值得挖掘和提升。為了進一步推動大數據助力疫情防控,以下3個問題亟需得到解決。
一是數據采集手段原始,質量較低。一些政府部門和基層組織在采集疫情相關數據仍然采用手工作坊式的人海戰術。在采集時通常采用手工填表、打電話等方式,這既給基層工作人員增加負擔,也無法保證數據的真實性。例如,在采集患者個人信息時,由于沒有區分所留手機號到底屬于病患還是其家屬,運營商系統核驗時就會存在大量身份證號與手機號不一致的情況,導致后續數據分析的準確性和真實性模糊。
二是數據流轉存在隱私泄露的風險。為應對新型冠狀病毒的防疫需求,有關部門第一時間制作了隱去個人隱私信息的確診患者相同行程查詢工具,但在原始數據上報過程中,數據還是遭到了不同程度泄露,這給被泄露人的生活帶來了極大不便。
三是跨地區、跨層級、跨部門的數據流轉難以實現。大數據的核心在于互聯互通。針對個人的行為分析,手機信令僅能提供較為粗糙的移動軌跡,對區域性分析結果影響較小,但對于軌跡精確度要求高的防疫場景,則需要更多例如火車、飛機、共享單車、網約車、搜索引擎、社交媒體等更多維度跨層級和跨領域的信息。目前,不同企業和政府部門的數據呈現“孤島”形態,數據亟需高效整合,才能更好應用于疫情治理。
打破“孤島”形態
基于以上提出的問題,面對不斷蔓延的疫情形勢,建議有關部門在以下3個方面進行改進和強化。
一是提升采集手段,強化數據校驗。要通過各種技術手段,避免數據低效采集。例如,各地疾控部門對于患者的流行病學調查,除了通過對患者直接的調查采訪外,還應從有關部門采集患者的手機信令數據、交通出行數據,甚至是微信、支付寶等基于位置服務的數據(LBS數據)。這些數據的準確度往往比手工采集要高得多。此外,還需要進行多方數據校驗,從源頭上提高數據質量,為后續的數據分析奠定良好基礎。