大多(duō)数(shù)人在谈(tán)论人工智能(néng)的(de)未来时,都会联想(xiǎng)到黑客帝国中邪恶的网络(luò)或者终(zhōng)结(jié)者中(zhōng)的电子人杀(shā)人(rén)机器。
当今的人工智能无(wú)法完全取代人类的工作,机器人不会带来世界末日(rì)。无论(lùn)是伦理学家还是计算机科学家(jiā)都(dōu)不(bú)认为机(jī)器人的未来会走向(xiàng)世界(jiè)末日。对人类(lèi)来说,人工智能的前景非常广阔,可以(yǐ)让(ràng)我们(men)的世界越来越美(měi)好(hǎo)。
本文描述的场景不仅可以帮助你理(lǐ)解当(dāng)前AI的使用方式,而且还可以让(ràng)你想象AI未来(lái)的发展潜力。
AI的社会成本
当前AI技术面临的最大难题是由于数据集不完整而(ér)导(dǎo)致的错误,主要问题之一是决策方面的偏见。人们(men)已经意识(shí)到这些错(cuò)误,并正在逐步克(kè)服。
考虑一下美国刑事司法系统做出(chū)带有偏见决(jué)策的那段历史,金融业和教育机构也存(cún)在同(tóng)样的偏(piān)见(jiàn),机器(qì)学习(xí)模型也在重复(fù)人为的偏见。
COMPAS系统是一个带有偏见的(de)AI示(shì)例。美国(guó)有几个州使用该软(ruǎn)件来确(què)定(dìng)犯罪分子的风险等级。COMPAS使用了(le)具有少量风险(xiǎn)因素和特(tè)征的数据集,最终(zhōng)的算法将黑人(rén)被告标记为(wéi)高风险的偏向(xiàng)性更高。这些虚假标志出现在黑人(rén)身上的概(gài)率是白(bái)人的两倍,结果导致黑人被判刑的频(pín)率高于白人,且更严厉。
当AI模型(xíng)使用有(yǒu)限(xiàn)的视觉数(shù)据集(jí)时,也会引发有偏见的决(jué)策。例如,仅在(zài)高(gāo)加索人(rén)脸数据集上训练了人脸识别系统,然后将其应用于现实世界中(zhōng)的各种人(rén)群。
最(zuì)后的误差就很(hěn)严重:非裔(yì)美国人和亚洲人被误识别的比率比白种人高10-100倍。美国国家标准(zhǔn)技术研究院(The National Institute of Standards and Technology,即NIST)发现,由(yóu)于存在这些差异,许多当前的(de)面部识别系统不能(néng)在(zài)执法(fǎ)和国家安全(quán)领域使用。
为了(le)避(bì)免偏差,负(fù)责人脸识别应用程序开发的数据(jù)科学(xué)工程师(shī)必须考(kǎo)虑在(zài)多样性的(de)数(shù)据集上训(xùn)练模型。
面临禁止的人(rén)脸识(shí)别
对于(yú)政府和企业(yè)来说,人脸识别是一项前(qián)景广阔的技术,但事实并非如(rú)此。由于某些原(yuán)因,社(shè)会并不(bú)赞同(tóng)。
美国奥克兰和旧金山的(de)警察部门和公共机构禁止(zhǐ)使用面部识别技术,俄勒(lè)冈(gāng)州、加利福(fú)尼(ní)亚州(zhōu)和(hé)新罕(hǎn)布什尔州的警察部门(mén)不能在警用摄像机(jī)中使用(yòng)该技术。四分之一的美(měi)国居民认为,联邦政(zhèng)府应限(xiàn)制面部识(shí)别技术的(de)使用。而且除了美国之(zhī)外,别(bié)的(de)国(guó)家(jiā)也有类(lèi)似的现象。
-
欧盟的(de)通(tōng)用数据保护条例(General Data Protection Regulation,即GDPR)发现面部识别不符合条例(lì)要求。2019年,一所瑞(ruì)典学(xué)校以受限的方式(shì)使用软件来跟踪学生的出(chū)勤(qín)率(lǜ),虽然(rán)学(xué)生家长(zhǎng)同意收集生物识(shí)别信(xìn)息,然而欧盟还是对(duì)该校进行了罚款。DPA裁定面部识别之类的生物识别(bié)技术(shù)属于隐私(sī)数(shù)据,根据该法规,除非参与识(shí)别活动的(de)人同(tóng)意收集隐私数(shù)据,否则不能收集(jí)和存储隐私数据。
2020年初,欧洲委员会就是否(fǒu)禁止在公(gōng)共场(chǎng)所进(jìn)行面部识别(bié)展(zhǎn)开了辩论(lùn),拟(nǐ)议的禁令将持续五年。这项(xiàng)禁令(lìng)从未真正实施过,委(wěi)员会(huì)人工(gōng)智能白皮书的最终版本(běn)中已经删除(chú)了(le)这(zhè)项禁(jìn)令。
目前,美国有自己的地方法律,与GDPR接近。加(jiā)州的消费者隐私法案与GDPR如出一辙(zhé),是美(měi)国数据(jù)隐(yǐn)私(sī)的默认标准。法规和指(zhǐ)导方针(zhēn)限制了面部识别技术的创新。
尽管消费者团体和政府机构设(shè)定了各种限制,但创新者仍在开发(fā)面部识别软件,这项技术在中国和美国越(yuè)来越受欢迎。2019年,面部识别的市(shì)场价值高达50.7亿美元(美国(guó)),到2025年(nián),经济(jì)学家(jiā)预计,在未(wèi)来五年(2020年-2025年)的复合年增长率为12.5%的情况(kuàng)下,该领域的市场价值将达到101.9亿美元。有(yǒu)人预测,面部识别技术有望(wàng)进(jìn)入零(líng)售市(shì)场(chǎng),用于提高(gāo)销售以(yǐ)及个(gè)性化购物体验。
AI技术的另一面
现代监控基础设施需要面(miàn)部识(shí)别(bié)技术,中国等国(guó)家依靠这种技(jì)术来维(wéi)持社会控制,这(zhè)种用途让禁(jìn)止和提(tí)高面(miàn)部识别限制的呼声越来越高。然而,面(miàn)部识别是一种可用于其(qí)他(tā)方面的多用(yòng)途技术(shù),面部识别技术可以在公共健康与安全中发挥至关重(chóng)要的(de)作用(yòng)。
政(zhèng)府和私营企业正在使用面(miàn)部识别技术来遏制COVID-19。代理商可以要求当地居民(mín)或(huò)员工在扫描QR码之(zhī)前提供旅(lǚ)行历史、姓名、身份证号(hào)码和体(tǐ)温。扫(sǎo)描后,再(zài)授予(yǔ)区域(yù)的访问(wèn)权限。此外,社交媒(méi)体平台也在积(jī)极跟(gēn)踪人们的出行(háng),并启用了热线(xiàn)供用户报告疾病,这(zhè)些信息提供(gòng)了有关热点和区(qū)域分布的(de)信(xìn)息。
在(zài)中国,面部识别技术可以检测到人群中体温(wēn)较高的人,还可以检测某个人是否戴口罩(zhào)。报告显示(shì),面部(bù)识别技术可以识别戴(dài)口(kǒu)罩(zhào)的人(rén),准确率达(dá)95%。面向消(xiāo)费者的应(yīng)用可以捕获个人健康信息,向用户提(tí)供有关附近人员健康的信息。
在2008年北京奥运会之后,面(miàn)部识别技术就进入(rù)了公共领域。自2015年以来,中国政府机构、金融服务(wù)和零售部门都开始广泛(fàn)使用(yòng)面(miàn)部识别技术。虽然人们对于(yú)该项技术的广泛(fàn)使(shǐ)用(yòng)感到(dào)担(dān)忧(yōu),但公众似乎接受(shòu)了(le)实际的使用(yòng),并且在某(mǒu)些情(qíng)况下(包括抑制COVID-19的(de)传播)对(duì)该项(xiàng)技(jì)术表示(shì)赞赏。
揭(jiē)露危险
自然(rán)语言处理(lǐ)是(shì)人工智能改变未来(lái)的另一个(gè)例子。在COVID-19迅速传播(bō)到中国以外的国家之前,自然(rán)语言处理技术提供了(le)可(kě)以挽救生命的情报(bào)。
BlueDot是一(yī)个AI平台,使(shǐ)用(yòng)自然语(yǔ)言处(chù)理和机器学习(xí)来追(zhuī)踪全球的传染(rǎn)病,其实现采用了(le)可快速浏览大(dà)量(liàng)资源的算法。该算法旨在标记流行病(bìng)的早期迹象,在2019年12月的最后(hòu)几周里(lǐ),该平(píng)台在中国武汉发现了一群确诊的(de)“异常(cháng)肺(fèi)炎”患者。一周以后,世界卫生组织(WHO)正式发表声明,称武汉一名(míng)患(huàn)者患有“新型冠状病毒(dú)”。
BlueDot并不(bú)是(shì)唯一可以(yǐ)在(zài)数(shù)千个(gè)来源(yuán)中标记(jì)出关(guān)键领域的AI。全球电(diàn)子商(shāng)务巨(jù)头阿里巴巴(bā)创建了(le)由自然语言处理模(mó)型提供支持的StructBERT,该模型能够快(kuài)速处理病毒基因序列,并筛(shāi)选蛋白质(zhì)。阿里巴巴(bā)已经(jīng)将该平(píng)台用于对抗COVID-19,研究人员和科(kē)学家可(kě)以免费使用该模(mó)型来(lái)加速疫苗(miáo)的开发。
寻找治疗新病(bìng)毒的方(fāng)法(fǎ)
透过(guò)2020年2月发布的两(liǎng)份论文,我们(men)可以看到人工智能如何改变公共卫生(shēng)和生物技术未来。
一篇论文描述了总部位于韩(hán)国的Deargen开发和实现机(jī)器学习模型的过程(chéng),该(gāi)模型(xíng)确定了四种可减(jiǎn)缓COVID-19影响(xiǎng)的抗病(bìng)毒药物(wù)。Deargen的MT-DTI是(shì)一种(zhǒng)学习模型,依(yī)赖于(yú)化(huà)学序列(而不是2D或3D分子结构),该模(mó)型可以预测目标分子(zǐ)(例如病毒)是否会与目标蛋白结(jié)合。阿扎那韦(Atazanavir)是一种抗HIV药物,已获得FDA批准。MT-DTI发(fā)现,阿扎那韦可以(yǐ)与(yǔ)位(wèi)于SARS-CoV-2分子外部的蛋白质结(jié)合,并阻止其与人蛋白质结合的能力,SARS-CoV-2引发了COVID-19。
总(zǒng)部位(wèi)于香港(gǎng)的Insilico Medicine还于2月(yuè)发布了另一篇论文。Insilico使用基于AI的(de)平台对数千个新颖分子进行(háng)建模,希望寻找可(kě)以(yǐ)破坏SARS-CoV-2复制的新型分子。
这些公司(sī)只是众(zhòng)多致力于寻(xún)找(zhǎo)抗病毒方法(fǎ)的科技公(gōng)司、学术(shù)研究实验(yàn)室和政府科学家中的两家(jiā)。人们创建了一个开放的数据(jù)集来帮助组(zǔ)之间的通信,COVID-19开(kāi)放研究数据(jù)集(CORD-19)是所有(yǒu)该主题(tí)研究的中(zhōng)心枢纽,其中的数据可(kě)通过计算机读取,且在(zài)不断更新。任何访问数据库的人(rén)都可以(yǐ)获(huò)取(qǔ)存储(chǔ)的数据,并将其轻松地应用于机器学习模型(xíng)和AI技术,这可以加快目(mù)前全球的(de)研究速度。
COVID-19后的AI未(wèi)来
人工(gōng)智能的未来取决于人类管理和(hé)创新解决方案。科(kē)学家和研究人员在他们的脑(nǎo)海中(zhōng)构思治愈的方(fāng)法(fǎ),人类(lèi)的创造力利用机器解析的数据,并以有(yǒu)意义的方式将其组合(hé)在一(yī)起。如果没有(yǒu)人类提供的输(shū)入,AI只是一个有效的数据(jù)收(shōu)集器,仅(jǐn)此而已。COVID-19危(wēi)机(jī)凸显了AI的真正威力(lì),创新人员可通(tōng)过设置(zhì)模型来确定AI的实(shí)用性以及价(jià)值(zhí)。
现在决策者可以做些什么?
此次疫(yì)情迟早会结(jié)束。虽(suī)然疫情给经济带来的影响尚待确定,但(dàn)COVID-19对经济的影响(xiǎng)存在若干情况。
决策者可以选择(zé)发展、创新(xīn)和(hé)采用新技术。我们所要做的事了(le)解真实情况,并(bìng)伺机而(ér)动。