在全球抗击(jī)新(xīn)冠肺(fèi)炎(yán)(Covid-19)疫(yì)情方面,各(gè)种各样的高新科技都有(yǒu)望“大显身手”,其中(zhōng)最突出的是自然语言处理(lǐ)技术(shù)。无论是在抗疫(yì)一线,还是在社区(qū)管控、疫苗(miáo)研发(fā)等大后方,自然语言(yán)处理技术发挥的(de)作用都(dōu)不可忽视。目前世(shì)界上有(yǒu)多个研究团队使用该技术抗击新冠疫情,并取(qǔ)得了可喜(xǐ)的成果。
在(zài)新冠疫情中,最早正式发出疫情警告的并不是世(shì)界卫生组织或美国疾控中心,而是加拿大一家名为“蓝点”(BlueDot)的健康监(jiān)测平台;它(tā)早在2019年(nián)12月31日就向其(qí)客户(hù)发出了提前疫情警告,避开危险区域。该平台(tái)设计(jì)了疾病监测分(fèn)析程序,使用自然语言处理技(jì)术来筛选65种语言的新闻报道,以及航空公司(sī)数据和动物疾病暴(bào)发的报(bào)道,在(zài)疫情暴发之初发挥了监(jiān)测功能(néng)。
前不久,美国(guó)艾伦人(rén)工(gōng)智(zhì)能研(yán)究所发布了“新冠肺炎开(kāi)放研究数据集(jí)”(CORD-19)的资源管理(lǐ)器以及全文本(běn)搜索引(yǐn)擎,并表示希望它可以帮助人(rén)们探索数(shù)据(jù)集并(bìng)确定潜在的研究成(chéng)果。该机构语言学家道(dào)格(gé)·雷蒙德博士说:“过去(qù)几年,我们(men)在自(zì)然(rán)语言处理(lǐ)方(fāng)面取(qǔ)得了长(zhǎng)足进步,CORD-19这(zhè)类数(shù)据(jù)集(jí)的(de)实用(yòng)性(xìng)可(kě)能会比几(jǐ)年(nián)前(qián)更大,因为现在我们有了更(gèng)多可用的(de)工具(jù)。”
美国政府曾经宣布(bù)联合艾伦人(rén)工智(zhì)能研(yán)究所、微软研(yán)究院、美国国立卫生研(yán)究院等机构共同发布有关新冠疫情的学术文献的开放(fàng)研究(jiū)数据集CORD-19,并呼(hū)吁世界各地的人工智能专家采取行动,开发新的文本和数据(jù)挖掘技(jì)术,以帮助科学界(jiè)回答与新冠(guàn)疫情相关的(de)高优(yōu)先(xiān)级科(kē)学问题。其目的是为(wéi)医学和自(zì)然语(yǔ)言处理研究人员发布疫情数据集,以获得有助于对抗此(cǐ)次(cì)疫情的真知灼(zhuó)见。
美国哈(hā)佛大(dà)学医学院的(de)研究人(rén)员借助自然语言处理技术最近开发出了一(yī)种工(gōng)具,可以评估新(xīn)冠患者的(de)病例、社交(jiāo)媒体(tǐ)和健康卫生数据。他们率先努力通过使用机器学(xué)习和大数(shù)据分析查看来自各种来源的数(shù)据和信息(xī)来寻找新冠病毒的解决方案。借助自然语言处理工具,他们还(hái)可以搜(sōu)索有(yǒu)关新冠(guàn)病毒的在线信息,并了解爆发的当前位置。
中国(guó)疾病预防控制中心的研究人员最(zuì)近在使(shǐ)用科技巨头阿里巴巴达摩院的自然语言处理(lǐ)技术开(kāi)展病历文本分析(xī)和流(liú)行病学调查工作,并(bìng)取得(dé)了(le)阶段性成(chéng)果。达摩院的研究团(tuán)队通过自然(rán)语(yǔ)言处理回顾性数据(jù)、使用卷积(jī)神经网络训(xùn)练(liàn)CT影像(xiàng)的识别系统,它可以(yǐ)快速鉴别新冠影(yǐng)像与普通病毒(dú)性(xìng)肺(fèi)炎影像(xiàng)的区别,最终识别(bié)准确率(lǜ)高达 96%。
智能(néng)问诊(zhěn)系统(tǒng)能(néng)够在(zài)线为病(bìng)患提供(gòng)问诊(zhěn)服务,其使用应用语义理解(jiě)、情感(gǎn)分(fèn)析等自然语(yǔ)言处理技(jì)术,通过问题预判、意图反(fǎn)问、分(fèn)类识别、相似度(dù)匹配等(děng)方法,不仅能够解答何种情况需要就医,还能(néng)实现疫情防(fáng)控动(dòng)态进展(zhǎn)、科学防护知(zhī)识、谣言鉴别(bié)等问(wèn)题精准解答,并支持人机协作、自主(zhǔ)学习、会话引导等功能。
在疫情防控期间,中国(guó)百(bǎi)度灵医智(zhì)惠推(tuī)出的“智能咨询助手”,包含新(xīn)冠问题(tí)解答、标准化预问诊路径、在线(xiàn)医生(shēng)咨询辅助三大模块;它通过自然语言(yán)处(chù)理技术(shù)赋能在线(xiàn)健康咨询平台、政府疫情(qíng)防控(kòng)平台、互联网医院(yuàn)等(děng)第(dì)三方平台,助力其直接为公众提(tí)供有关新冠的在(zài)线科(kē)普(pǔ)、在线(xiàn)咨询,倍数级(jí)提(tí)升效(xiào)率。
疫情发(fā)生(shēng)至今,情况愈演愈烈,人们一边要提防新(xīn)冠肺炎的(de)传染,一边又要不断接受着海量的真假(jiǎ)难辨的(de)信息(xī)的(de)轰炸(zhà)。但对于后者,自然语言处理(lǐ)技术(shù)能够帮助人们提取信息的主要观(guān)点(diǎn),识别文章(zhāng)情绪甚(shèn)至分(fèn)析文(wén)章的可信度;这在抗疫信息战(zhàn)中将“谣言”粉碎,促进舆论生态良性(xìng)循环,从而为(wéi)抗疫工(gōng)作提供一(yī)份(fèn)助力。
自(zì)然语(yǔ)言处理技术(shù)在对抗新冠疫情中发挥了重大作用。虽然自然语言处理技(jì)术不是万能神药,但可以帮助研究人员(yuán)更快地从医疗数据中提取更有用的信息(xī),挖掘其(qí)中的规律,从而(ér)加快(kuài)疫苗研发进程,也有助于进行更有效的治疗。自然语言处理技术在本次疫情中的应用证明其在分析医疗(liáo)和(hé)临床数据中大有可为。
由上可知,自然语言处理可以在抗击新冠(guàn)疫(yì)情(qíng)中大显身手(shǒu),为打赢这场疫情攻坚战提供了极为有效(xiào)的技术支撑。有(yǒu)了自然(rán)语言处理技术(shù)相(xiàng)助,抗疫工作将变(biàn)得更(gèng)安全、更(gèng)高效。正如中国著名学者周海中教授曾(céng)经所言:“自然语(yǔ)言处理是极有吸(xī)引(yǐn)力的(de)研究领域,它具(jù)有重大(dà)的(de)理论意(yì)义和实用价值(zhí)。”
文/李言(作者单(dān)位:德国人工智(zhì)能研究(jiū)中心[DFKI])