当前,新冠病毒肺炎(yán)疫情在国内已(yǐ)经得到有效控制,复工(gōng)复产正(zhèng)在(zài)全面推进之中。那么,目(mù)前经(jīng)济复苏的情(qíng)况究竟如(rú)何?各行各业以及各(gè)地区的发展形势有(yǒu)何差异(yì)?百度公司最近发布(bù)的(de)2篇论文 [1, 2] 研究发现,这些答案(àn),都“藏”在海(hǎi)量的大数据里。
研究表明,百度地(dì)图的用户和商户数据(jù)情况与GDP走势呈现高度相关性(xìng),成为呈现行业和地区经济(jì)复苏情况的(de)“晴雨(yǔ)表(biǎo)”。同时,百度地图、搜索和健康平(píng)台(tái)的数据显示,某一地区人口流(liú)动(dòng)情况以(yǐ)及搜索习惯,与该地区的疫情形势紧密相关。由此可见,百度多维度大(dà)数据(jù)能够有效地为疫情发展及其(qí)社会影响“画像”。
中国传媒大学调查统计(jì)研(yán)究所所长、大数据(jù)挖(wā)掘与社会计算实(shí)验(yàn)室主任沈浩(hào)表示(shì),在抗击新冠肺炎(yán)疫(yì)情的斗(dòu)争中,全国各(gè)地的政府(fǔ)、企业(yè)和科研机构(gòu)都在探索运(yùn)用大数据手段(duàn)提升治理能力、加强抗(kàng)疫效(xiào)果。未来(lái),百度的大(dà)数据不仅能够作为政府(fǔ)防控疫情的有(yǒu)益参(cān)考,同时也可(kě)以为推动复工复产、提振经济发(fā)展提(tí)供(gòng)有力的决策依(yī)据。
L型、勾型、V型(xíng):百度大数据直观量化疫情对(duì)经济(jì)发展的冲击情(qíng)况 [1]
成都闹市区的(de)奶茶已(yǐ)经回归了往(wǎng)日的热闹,而天(tiān)津旅游景(jǐng)区的小饭馆却迟迟难以复苏;西北(běi)县(xiàn)城(chéng)的超市恢复(fù)了元气,长江中部(bù)的工厂则(zé)尚未将产量(liàng)提升至疫情之前(qián)的平(píng)均水平……这(zhè)些情况(kuàng),百(bǎi)度大数据都“看”到了。
百度大数据(jù)的研究(jiū)者在试图摸清地图数据与经济复(fù)苏情况的(de)关联时,发现了两个关键因子——地图用户到店(diàn)数(shù)量(Volumes of Visits to Venues,简称V3)与商(shāng)户新开设的地(dì)理(lǐ)位置点数量(New Venues Created,简称NVC)。V3可以反映用户的活(huó)跃程度(dù),NVC则反映商户的活跃(yuè)程度。
于是(shì),研究(jiū)者将这两个数据的走势与GDP走势做成可视化图表,结果发现,NVC、V3与GDP的走势,呈现(xiàn)强烈的正(zhèng)相(xiàng)关,也就是说(shuō),地图用(yòng)户到店的情(qíng)况与商户新开设(shè)的地理(lǐ)位(wèi)置(zhì)点情况(kuàng),可以反映经济(jì)活动的强弱。
图1:从2018年第一(yī)季度到2020年第一季度(dù),每(měi)个季度的国内GDP与百度地(dì)图用户(hù)到(dào)店数量,新开设(shè)的地理位置点数量,呈现强烈正相(xiàng)关。(注:分析(xī)所用的数据皆为脱敏(mǐn)数据,所(suǒ)有处理环节均(jun1)不涉及个体隐(yǐn)私(sī)。下同。)
那么,这一发(fā)现(xiàn),除了作为(wéi)经(jīng)济活动的晴雨表(biǎo),还有什么作用呢?
百(bǎi)度研究(jiū)人员又做出了进一(yī)步的分析。他们对各个(gè)行业、各个地(dì)区省份的(de)经济活(huó)跃程度进行(háng)了细(xì)致分析,结果发现,不同行业、不同(tóng)地区之间(jiān),经济(jì)复苏情况呈现巨大(dà)差异,主要分为以下三类(lèi)——L型(xíng)、勾型、V型。
先来(lái)看L型。这一曲线显示复苏缓慢,说明受(shòu)疫情影(yǐng)响很大(dà),目前(qián)仍(réng)然无法回到(dào)2018年同期的水平;教育、交通运输、酒旅(lǚ)等(děng)行业(yè)遭(zāo)受非(fēi)常严重的打(dǎ)击。下图分别是机(jī)场、火车站(zhàn)、教育(yù)培训机构、酒店的用户到(dào)店(diàn)情况。可以看(kàn)到,代表今年情(qíng)况(kuàng)的红(hóng)色V3曲(qǔ)线(xiàn),呈(chéng)现“L”形(xíng)状,依(yī)旧在(zài)低谷摇摆。
图2:上图为机场、火车站、教(jiāo)育(yù)培训机构、酒店的用户到店(diàn)情况(V3)和新开设的地理位置(zhì)点情况(NVC)
再来看勾型。虽遭受疫情影响,但是疫情缓和(hé)之后,能够恢复到2018年与2019年同期(qī)之间的经济水(shuǐ)平(píng)。餐饮酒(jiǔ)吧、休闲娱乐、公(gōng)园景点等是典型的行业代表。这一(yī)复苏情(qíng)况在(zài)V3的(de)可视化图表(biǎo)里(lǐ)很像一个反(fǎn)写的“对(duì)勾”。
图3:勾型:疫情缓和(hé)之后,餐馆酒吧(ba)、娱乐设施、旅游景点等行业能够恢复到2018年与2019年同(tóng)期之(zhī)间的经济水(shuǐ)平(píng)
最后看(kàn)V型。尽(jìn)管疫情的影(yǐng)响严重,但是(shì)一(yī)旦(dàn)疫(yì)情缓和之后,能够快速触底(dǐ)反弹,恢复到(dào)2019年(nián)同期水平,甚至比那时情况更好。代表行业有工作居(jū)住(zhù)的(de)地点(diǎn)、商超、医院药店(diàn)等。
图4:V型:疫情缓和(hé)之后(hòu),工作居住地点(diǎn)、商(shāng)超、医院(yuàn)药店等(děng)景气程度快速反弹,走势看上去像字母V
研究人员用类似的思路,将全国经济(jì)按照区域进(jìn)行(háng)分析,发现湖(hú)北、北京及天津的经济复苏情况为L型,复苏缓慢,与(yǔ)持续的疫(yì)情管控以及旅行限(xiàn)制有(yǒu)关(guān);南部沿海(hǎi)、黄河中游、东部沿海、长江中游和北部沿(yán)海的数据显示(shì)出(chū)明显的勾型复(fù)苏趋势;大西北、东北和西南区域则(zé)展(zhǎn)现出强劲的V型反弹趋势。
百度大(dà)数据研究(jiū)专家表示,五大经济区(南部沿海,黄河中游,东部沿海、长江中游、北(běi)部沿海)高度依赖全球供应(yīng)链的经济,在国内疫情结(jié)束(shù)之后,依然受到(dào)国际整体(tǐ)疫情和(hé)经济形势的(de)影响(xiǎng),未能快速反弹,呈现中间态的勾型;而西北、东北、西南等地(dì)区经济对(duì)外依赖性相对较小,疫情感(gǎn)染人(rén)数(shù)没有(yǒu)其他五大经济(jì)区多(duō),恢复快,经济经历短(duǎn)暂阵痛之后,触底反弹。
搜索COVID-9越(yuè)多,疫情防(fáng)控工作越好?百(bǎi)度大数据“揭秘(mì)”疫(yì)情防(fáng)治、人口迁(qiān)徙(xǐ)与搜索行为间的显著关联 [2]
百(bǎi)度大数(shù)据(jù)还发(fā)现了人口出行情况、搜索情况与疫情(qíng)防控(kòng)之(zhī)间的紧密关联。
先来看第一项发现:从武汉移出到中国其他(tā)主要城(chéng)市人口情况,与当地疫情传染情况(kuàng)的关(guān)系(xì)存在显著(zhe)的(de)正相(xiàng)关。
百度大数据统计了(le)截至3月31日中(zhōng)国(guó)内地(dì)300个除湖北外主要城市的确诊感染人(rén)数,将其与1月23日(rì)迁(qiān)入该城(chéng)市的人口(kǒu)数做出了对比。
图5:截至2020年3月31日中国内地各主要城市确诊人数 (上图) /当地确诊率 (下图) vs 2020年1月1日至23日从武汉迁入(rù)人(rén)数
上面(miàn)左图展示了全国主要(yào)城市每(měi)个城市(shì)从武汉迁入人数(x-轴)与截止到3月31日(rì)当地(dì)累(lèi)计确诊(zhěn)人数(y-轴)的关联。二者存在(zài)显著正相关。说明(míng),当(dāng)地(dì)累(lèi)计(jì)确(què)诊(zhěn)人数与当(dāng)地迁入(rù)的(de)武(wǔ)汉(hàn)人(rén)数存在直接的关(guān)联。
考虑到城市大小的关系,百度研究者也以当(dāng)地感染率(每百万人平(píng)均感确诊(zhěn)人数(shù))与从武(wǔ)汉迁入人数(shù)做出了分分(fèn)析统计(jì),如右图。结果依(yī)然是显著正相关。
由此可以(yǐ)得出结论——在武(wǔ)汉封(fēng)城之前,从(cóng)武汉迁入人(rén)口更多的城市,会(huì)有更高(gāo)的感染人数;同理推断,武汉越早采取封(fēng)城(chéng)措施,则疫情波及范围越小。
再来看第二(èr)项研究结果。数(shù)据显(xiǎn)示,疫情越严重的地(dì)方,人均搜(sōu)索(suǒ)COVID-19相关关(guān)键词的次数也越多。
图6:2020年1月33月31日中国大(dà)陆(lù)各主要城市(shì)人均COVID-19搜索次数 v.s 该城市确(què)诊人(rén)数 (上图) /确(què)诊率(下图)
可(kě)以(yǐ)看出,中国内地除湖北外(wài)主要城(chéng)市确诊感染人数(shù)与该城市人均搜(sōu)索COVID-19相关关键词的次数(shù)存(cún)在显著(zhe)正相关。由(yóu)此得(dé)出结论,可能是由于感染情(qíng)况引发的恐慌心理,人(rén)们(men)更愿意搜索相关(guān)信息。
百度的研究还发现,全国除湖北外主(zhǔ)要城(chéng)市(shì)的出(chū)行恢复(fù)率(lǜ)与当地人(rén)通过百度搜索(suǒ)COVID-19次数呈现显著的负相关。也就是说,人均通过百度(dù)搜索COVID-19关键字较多的城市,人们出行意愿更低(dī)、或是当地疫(yì)情管控措施更为严格 (在排(pái)除(chú)了(le)其他潜在因素的偏相(xiàng)关性分(fèn)析后,此关联依然显著)。
图7:截至2020年3月(yuè)31日中国(guó)大陆各主要城市出行恢复率 v.s 该城市人均COVID-19相关(guān)信(xìn)息搜(sōu)索次(cì)数:上图(Log-Log Plot), 下(xià)图(tú)正常尺度 。
可以看(kàn)出,当人们主(zhǔ)动搜(sōu)索(suǒ)信息得到(dào)了更多有关疫情的消息时,便更愿意待(dài)在家里。可以说(shuō),百度数据(jù)对(duì)人(rén)口隔离政(zhèng)策和移动限制政策(cè)提(tí)供了重要参(cān)考。
大数据(jù)全(quán)面赋能疫情(qíng)防控(kòng):真实掌握(wò)+有(yǒu)效预(yù)警+精准施策(cè)
从上数研究结果可(kě)以看出,百度地图、搜索和健康(kāng)的多维度数(shù)据能够直(zhí)观呈现(xiàn)疫情发展及其社会影响。沈浩认为,百度大数据对于征服(fú)开展疫情防控(kòng)与社会治理而(ér)言,有着突出意(yì)义。
其一,有利于全面、真实(shí)、动态掌握疫情防控情况。平时(shí)访问发热(rè)门(mén)诊数量的(de)人是否显著增多?疫情期间居家隔离情况执行(háng)如何?百度都能够(gòu)第一时间给予(yǔ)直(zhí)观、真实的数(shù)据化呈(chéng)现(xiàn)。
其(qí)二,对可能发生(shēng)的(de)疫情(qíng)相关风险提出预警。百度地(dì)图数据可以(yǐ)直接为疫情期间居家隔离政(zhèng)策、出行(háng)限制政策执(zhí)行情况(kuàng)提供参考,对危险信号提(tí)出预警。
第三,动态掌复工复产、经(jīng)济发展的真实情况,形成真实全面的“景气指数”。各地、各行业复工(gōng)复产情况究(jiū)竟如(rú)何(hé)?百度地图的(de)商户和用户活跃程度,便可以给予客观的(de)回应(yīng),作(zuò)为(wéi)政府机构精准施策(cè)的基础。
利用大数据提升社会治(zhì)理能力也是中国政府(fǔ)近年来不断努力的方向。
2月18日,工业和信息化部(bù)印发了《关于运用新(xīn)一(yī)代信息技术支撑服务疫情防控和复工复产工作的通知》,提出(chū)有效(xiào)应(yīng)用信息化手段(duàn)助力疫情防(fáng)控和复(fù)工复产。在中央精神的指(zhǐ)导(dǎo)下,社会各界纷纷探索以信息化途径高效开展疫情(qíng)防控。
实际上(shàng),在新(xīn)冠(guàn)肺炎疫情发生之(zhī)前,大数据在国(guó)内外公共卫(wèi)生事件中的应用效果已经(jīng)得到了较好的检验。此次疫情(qíng)发生后,韩(hán)国、日(rì)本、新加坡等国家(jiā)均(jun1)采用了(le)大数据手段防(fáng)控疫情(qíng)、指导经济活动,取得(dé)了良好的(de)效果。
在中国(guó),相(xiàng)较17年前的SARS疫情,大(dà)数据在此次新冠疫情防控中的作(zuò)用尤为明显,涵盖个人健康状况认证、远(yuǎn)程医疗问(wèn)诊、应急物(wù)资调(diào)配等方(fāng)方(fāng)面面。
“互联网公司掌握社会许多层面的数据(jù),政府一方(fāng)面要对数(shù)据的合规性加强监管,另(lìng)一方面(miàn),也要(yào)积极利(lì)用互联(lián)网公司的大(dà)数据(jù),可以(yǐ)联合科研院所和(hé)企业大数据机构协同进(jìn)行(háng)大(dà)数据研究,助力疫情防控(kòng)、应急管理和社(shè)会的精细化治理,为(wéi)决策提供有益参考。”沈浩表示。