人流大數(shù)據(jù)和人工智能(AI)驅(qū)動(dòng)的新冠病毒(COVID-19)傳播建模預(yù)測(cè)和模擬推演平臺(tái)。 受訪者供圖一場(chǎng)突如其來(lái)的疫情打亂了人們的正常生活。疫情反反復(fù)復(fù),形勢(shì)依然不容樂(lè)觀。最近,廣東省再次出現(xiàn)疫情。利用人工智能和大數(shù)據(jù)技術(shù)最大程度減少經(jīng)濟(jì)代價(jià)并實(shí)現(xiàn)精準(zhǔn)防疫,對(duì)未來(lái)的常態(tài)化防疫工作具有重要意義。
在新冠疫情暴發(fā)初期,南方科技大學(xué)計(jì)算機(jī)科學(xué)與工程系研究員宋軒率領(lǐng)團(tuán)隊(duì)研發(fā)了“人流大數(shù)據(jù)和人工智能(AI)驅(qū)動(dòng)的新型冠狀病毒(COVID-19)傳播建模預(yù)測(cè)和模擬推演平臺(tái)”(以下簡(jiǎn)稱推演平臺(tái))。該平臺(tái)多次為國(guó)內(nèi)外科研單位輸出模擬推演結(jié)果,為政府制定高效防疫政策提供參考。“平臺(tái)在今年年初正式在深圳市啟動(dòng)了應(yīng)用示范實(shí)驗(yàn),并在5月完成了第一次校內(nèi)實(shí)驗(yàn)和數(shù)據(jù)分析工作。針對(duì)這次廣東省的疫情特點(diǎn),我們將于近期在中高風(fēng)險(xiǎn)區(qū)域開(kāi)展第二次實(shí)驗(yàn)。”宋軒在接受采訪時(shí)告訴《中國(guó)科學(xué)報(bào)》。
據(jù)他介紹,平臺(tái)的相關(guān)核心技術(shù)擁有自主知識(shí)產(chǎn)權(quán),目前已經(jīng)申請(qǐng)了40余項(xiàng)國(guó)內(nèi)國(guó)際專利。該成果不僅可以在新冠病毒疫情的防控工作上有所助益,還能應(yīng)用于災(zāi)難應(yīng)急和其他重大傳染病防疫,為保護(hù)人民的安全和健康做出貢獻(xiàn)。
能模擬分析疫情且能自我成長(zhǎng)
目前,當(dāng)疫情出現(xiàn)時(shí),主要管控方式還是以流行性病學(xué)調(diào)查尋訪源頭為主的傳統(tǒng)流調(diào),同時(shí)進(jìn)行地毯式排查與隔離。這種做法雖然穩(wěn)妥,但同樣需要投入大量人力物力。
對(duì)此,宋軒聯(lián)合深圳市疾病預(yù)防控制中心、深圳市智慧城市科技發(fā)展集團(tuán)有限公司等聯(lián)合攻關(guān)利用人工智能和大數(shù)據(jù)技術(shù),研發(fā)出針對(duì)新冠病毒傳播建模預(yù)測(cè)的推演平臺(tái),對(duì)常態(tài)化傳染病精準(zhǔn)防控提出一整套包含推演平臺(tái)和移動(dòng)設(shè)備端應(yīng)用程序在內(nèi)的綜合解決方案。
“推演平臺(tái)是針對(duì)新冠病毒傳播的大數(shù)據(jù)分析和AI建模平臺(tái),免備案服務(wù)器,通過(guò)整合、處理和分析各類多模態(tài)人流移動(dòng)和出行大數(shù)據(jù),結(jié)合新一代的人工智能技術(shù),完成對(duì)新冠病毒的傳播和感染人群細(xì)粒度建模,從而實(shí)現(xiàn)在城市區(qū)域內(nèi)細(xì)粒度預(yù)測(cè)、模擬和動(dòng)態(tài)推演傳播感染情況。”宋軒介紹說(shuō)。
使用者只需將人流大數(shù)據(jù)輸入平臺(tái),即可讓平臺(tái)自動(dòng)完成模型迭代訓(xùn)練,并得到相關(guān)的預(yù)測(cè)和模擬推演的可視化結(jié)果。“有別于傳統(tǒng)的經(jīng)驗(yàn)傳播模型,這一項(xiàng)目的核心算法模型完全由數(shù)據(jù)驅(qū)動(dòng),通過(guò)AI技術(shù)實(shí)現(xiàn)模型校準(zhǔn)和調(diào)優(yōu)。通過(guò)數(shù)據(jù)的累積和更新,模型可以不斷迭代優(yōu)化。”宋軒表示。
一般來(lái)說(shuō),個(gè)人尺度的感染風(fēng)險(xiǎn)由生活環(huán)境、移動(dòng)軌跡、接觸人群密切程度等跨領(lǐng)域多種要素共同決定?,F(xiàn)有理論與方法難以融合這些關(guān)鍵要素,實(shí)現(xiàn)對(duì)復(fù)雜移動(dòng)環(huán)境下個(gè)人尺度的感染風(fēng)險(xiǎn)的有效評(píng)價(jià)和建模。那么,如何解決細(xì)顆粒度、大規(guī)模潛在感染風(fēng)險(xiǎn)源檢測(cè)等問(wèn)題呢?宋軒介紹說(shuō),推演平臺(tái)通過(guò)建立復(fù)雜環(huán)境下個(gè)人尺度的感染風(fēng)險(xiǎn)評(píng)價(jià)模型,分別在不同時(shí)間尺度下、傳播概率與本質(zhì)安全的不同視角下的要素建模與分析方法,融合城市移動(dòng)性、傳播物理模型、個(gè)人軌跡追蹤、接觸風(fēng)險(xiǎn)概率特征與功能特性,使用多維度建模模型。
大數(shù)據(jù)與私密性并行
基于海量真實(shí)數(shù)據(jù)的反饋,推演平臺(tái)可定量評(píng)估不同防控措施的實(shí)施成效,為精準(zhǔn)施策提供支持。例如,當(dāng)再次出現(xiàn)新增病例時(shí),為避免“一刀切”造成的資源無(wú)序調(diào)度及大規(guī)模損耗,可以進(jìn)行模擬區(qū)域封鎖,定量評(píng)估封鎖位置、封鎖范圍、封鎖強(qiáng)度等因素對(duì)防控成效和經(jīng)濟(jì)社會(huì)的影響,從溯源手段、數(shù)據(jù)采集、成效評(píng)估等疫情研究全鏈條出發(fā),為合理制定防疫措施提供科學(xué)指導(dǎo)。
同時(shí),為最大程度地保護(hù)用戶隱私,宋軒研究團(tuán)隊(duì)利用AI技術(shù)在不跟蹤個(gè)人移動(dòng)軌跡、僅使用聚合數(shù)據(jù)的情況下完成了模型訓(xùn)練,用戶全程無(wú)需提供任何個(gè)人信息,做到了真正意義上的匿名化。“如何讓大數(shù)據(jù)與個(gè)人隱私并行,是我們團(tuán)隊(duì)研發(fā)過(guò)程中遇到的困難之一。”宋軒坦言,要在最大程度保護(hù)個(gè)人用戶隱私的前提下,完成模型訓(xùn)練并提升預(yù)測(cè)模擬和推演精度,是一件非常困難的事情。“我們需要在不跟蹤個(gè)人移動(dòng)軌跡、僅使用聚合數(shù)據(jù)的情況下完成模型訓(xùn)練。因此,這對(duì)我們的模型選擇和算法設(shè)計(jì)提出了很高的要求。為此,我們也開(kāi)發(fā)了一些新的算法,并使用了一些較為新穎的AI技術(shù)應(yīng)對(duì)這個(gè)挑戰(zhàn)。后續(xù),我們還需要對(duì)這些算法和模型進(jìn)行進(jìn)一步的改進(jìn)和完善。”
厚積薄發(fā) 造福人類








