"新基建"持(chí)续升温(wēn),人工智能作为其中的重要一环,正在高速发(fā)展。4月7日,36氪"超级沙龙"直播栏目举(jǔ)办"新(xīn)基建"专场,百(bǎi)度集团副总裁、深(shēn)度学习技术及应用国家工程(chéng)实验室(shì)副主任吴(wú)甜以"智能时代的AI基础(chǔ)设(shè)施建设与应用"为题,结合百度在人工(gōng)智能领(lǐng)域的技术成(chéng)果和落(luò)地案例,对"AI新基建"进行了解读。吴甜还在直(zhí)播中(zhōng)"剧透", WAVE Summit深度学(xué)习(xí)开发者峰会将在五(wǔ)月举办(bàn),届时会有一(yī)系列的(de)核心能力(lì)发布。
吴甜在直播中表示,AI新基建是一项全方位工作,AI基础设施则(zé)是(shì)其中(zhōng)的一(yī)个大型技术(shù)系统和工程系统。基于AI基础设(shè)施(shī)的持续(xù)应(yīng)用和(hé)创新,将(jiāng)反哺AI基础平台,促进整个(gè)AI系统进一步进化。目前百度(dù)大脑已经成为软(ruǎn)硬一体AI大生产平台,在语音识别、视觉理解、语义理解、深度学习平台等领域(yù)取得了重大(dà)突破进展,并在工业制造、能源电力等领域落地应(yīng)用,疫(yì)情期间,百度AI测温、智能外呼、AI算法、CT影(yǐng)像分(fèn)析模型等技术和(hé)产品,也在疫情(qíng)防控过(guò)程中发挥了巨大的应用价值。 AI产业化(huà)需要社会全(quán)方(fāng)位多方整合力量(liàng)创新(xīn),共生共赢的(de)生态系(xì)统(tǒng)应运而生,同时还要重视(shì)人才培养(yǎng),加大力度培养既懂应用场景,又懂AI技术(shù)的复合型新型人才,促成应用(yòng)更加繁荣。
吴甜直(zhí)播(bō)分(fèn)享包(bāo)含AI基础设施、AI应用(yòng)价值、AI生态系统、AI人才(cái)培(péi)养四个方(fāng)面,全文整理内(nèi)容如下:
大家晚(wǎn)上好!最(zuì)近这段时间随着加(jiā)快新基建的要(yào)求提出,新基建的建设已经成(chéng)为非常(cháng)重要的话题,我今天带来的(de)是关于人(rén)工智(zhì)能新型基础设施建的理解,后(hòu)面(miàn)我会简称为AI 新(xīn)基建。新型基础(chǔ)设施建设(shè)简称新基(jī)建,是以(yǐ)5G、人工智能(néng)、工(gōng)业互联网、物联网为代表的新型基础设(shè)施,本质(zhì)上(shàng)来说,它是信(xìn)息数字化(huà)的基础(chǔ)设施(shī)。AI新基(jī)建是非常(cháng)新的概念,今(jīn)天我(wǒ)分四个部分来介(jiè)绍我对AI新基建的理解。
一、AI基础设施(shī)
首先介绍的(de)是AI新基建中(zhōng)最基础、最重(chóng)要的硬核部分(fèn)——技术平台。以百度为(wéi)例,我们(men)以(yǐ)AI技术平台为核心构(gòu)建了一套AI基础设(shè)施(shī)。
AI技术涵盖的(de)子(zǐ)领域非常广,整个AI技术系统本身开放性很强,它和应用场景也有(yǒu)非(fēi)常多的结合(hé),和应用紧(jǐn)密相关,而且会(huì)随着(zhe)应(yīng)用持(chí)续进化,所以它(tā)也并不(bú)是一成不变(biàn)的,而是一个不断演进、演化的系统。
百度大(dà)脑是百度AI技术的集大(dà)成,简(jiǎn)单的(de)回溯一下百度大脑发(fā)展历程。
在(zài)百度成立(lì)之初就已经在大量使用AI技术了,比如在搜索引擎中使用自然语言处理、知(zhī)识图谱等技术(shù)。2010年开始(shǐ),百(bǎi)度开(kāi)始进行基础(chǔ)能力(lì)的积累(lèi),AI布局也自此开始初具雏形。2016年,百度大(dà)脑(nǎo)完成基础能力积累,AI能力开始逐步开放(fàng)。2017年,百度大脑构建了完(wán)整的(de)技术体系,AI能力进入(rù)了全面开放的阶段。2018年,百度(dù)大脑的核心技术进入(rù)到"多模态(tài)与(yǔ)深(shēn)度语义理解"阶(jiē)段,"多模(mó)态"就是综合(hé)语音、视觉、文本理解能力,并且是(shì)深度、多层(céng)次的语义理解,AI在这个(gè)时候开(kāi)始(shǐ)多维度(dù)、多层次的开放。2019年,百度大脑进一(yī)步升(shēng)级为软硬一(yī)体AI大生产平台,进入到AI能力和应用场景的(de)融合(hé)创新阶段,广(guǎng)泛的和各(gè)行各业场景结合,成为(wéi)了AI时代的生产平台。
先看一看AI大生产平台是一个什(shí)么样(yàng)的平(píng)台(tái)。这个名字大家可能会(huì)觉得有些黑盒,打开黑盒看,它的组成部分中,最基础的是(shì)算力和数据平台。在整个生产平台(tái)上,深度学习平台是底座(zuò)基础(chǔ),开发者可以在这个平台进行自己AI应用(yòng)的开发;这里也会(huì)有通用的AI能力,像语音、视觉、自然语言处理、知识图谱一系列AI能力的调用;再结合到场(chǎng)景当(dāng)中,有(yǒu)大量应场景需要进行定制训练的需求,所以开放(fàng)了定制训练平台;最终整个平台上积(jī)累的(de)能(néng)力需要和业务(wù)系统(tǒng)进行部署(shǔ)和(hé)集成,所以也提(tí)供了(le)部署(shǔ)与(yǔ)集成的工具与平台,在此基础上(shàng)形成技术解决方案。整个大生产平台有AI安(ān)全保(bǎo)驾护航,AI应用中(zhōng)安全也是重要的话(huà)题。
从平台底(dǐ)层向(xiàng)上,我们(men)逐层(céng)看看各部(bù)分的含义(yì)以及现(xiàn)在的(de)进展。最底(dǐ)层是AI基础架构(gòu),这是整个AI大生(shēng)产平(píng)台的计(jì)算底层。随着AI算法能力的提升,对于算力(lì)的要(yào)求是越来越高的(de),有这些算力(lì)的(de)基础(chǔ)资源,才有可能对大数(shù)据进行计算(suàn),最后产生AI算法模型。AI+5G的时代即将(jiāng)到(dào)来,未来计算将会无处(chù)不在,它会从云扩(kuò)展到(dào)端(duān)、边缘,在我(wǒ)们身边就能(néng)够(gòu)时刻进(jìn)行各种各样的计算。在百度大脑上全新的AI计算架构通过芯片层、互联层、系统层、调度层,能够进行协同(tóng)设(shè)计和技术创新,最终可以(yǐ)提供(gòng)百万(wàn)TOPS量级(jí)强(qiáng)大的(de)计算力。与此(cǐ)同时芯片、系统(tǒng)、设备都能够进(jìn)行互相连(lián)接,将不同(tóng)场景中的计(jì)算连接在(zài)一(yī)起,产生更大的计算能力。
百度(dù)在使用经典的芯片基(jī)础上,也(yě)有自研芯片(piàn),一个是云端通(tōng)用AI处理器"百(bǎi)度昆仑",针对语音、自(zì)然语言处理还有图像进行专项优化,性能可以更加(jiā)提升(shēng),同时百度昆仑和飞桨深度学习平台进行了深度适(shì)配,使编程灵活度更高,能(néng)够灵活支(zhī)持(chí)训(xùn)练和预(yù)测。同等性能(néng)下(xià)使用"百度昆仑",成本上可以(yǐ)降低10倍。这是(shì)云上的处(chù)理器,还有一(yī)款在端(duān)上的"百度鸿鹄",是专用于远场(chǎng)语(yǔ)音交互(hù)的芯片,这款芯片采用新的设计理念,遵循软件定义芯片全(quán)新(xīn)设计(jì)思路,这里面也有相应的核心参(cān)数,能够在100毫瓦功耗(hào)情况(kuàng)下(xià),支持远场(chǎng)语音交互核(hé)心(xīn)的阵列信号处理和(hé)语(yǔ)音唤醒能力。这些会用于车载语音交互和智(zhì)能(néng)家居产品场景,带(dài)来低功耗(hào)、高性能的产品,也带(dài)来更大的(de)想象空间。鸿(hóng)鹄芯片已经实现了量产(chǎn),现在已经在百度相应产品当中(zhōng)使用了。
向下连接芯片,向上连接了应用场(chǎng)景的就是深度学(xué)习框架及平台,在(zài)AI时代帮助开发者快速便(biàn)捷完成(chéng)深(shēn)度学习(xí)技(jì)术研发(fā),这是深度学习平台的使命。深度(dù)学习平台是(shì)智能时代(dài)的操作系统。
飞桨深度学习开源开放平台上(shàng)已经构建起(qǐ)了全方(fāng)位、全(quán)功能的一套平台,从飞桨(jiǎng)的(de)全景图可(kě)以看出,飞桨在核心框架层能够(gòu)支持(chí)开发者进行开发、训练、预测(cè),整个全流程的研发工作。百度在飞(fēi)桨上还发布了自己以及百度行业(yè)伙伴一起打磨验(yàn)证的(de)一(yī)系列工业级模型,建立了覆盖自(zì)然语言处理、视觉(jiào)、推荐、语音等主流(liú)AI算法的官方模(mó)型库。
真实在(zài)场景当(dāng)中(zhōng)应用的时候,往往(wǎng)还需要(yào)端到端配套的(de)开发套(tào)件,让(ràng)整个开发过程更加便捷(jié)、便利,并且能够复用以前做好的各(gè)种各样的积(jī)累(lèi)。飞桨(jiǎng)在(zài)语义理解、目标(biāo)检测、图像分割(gē)、点击率(lǜ)预估四(sì)大场景都有配套的套件(jiàn),可以(yǐ)非常便捷的使(shǐ)用。
在深(shēn)度学习各个方向上(shàng),飞桨平台上也提(tí)供了(le)相应的工具组件,从平台层使用(yòng)的时候(hòu)提供了服务平台。这样一个全方位的(de)、全功能的平台,其(qí)实是针(zhēn)对在众多(duō)应用过(guò)程当中(zhōng)不断发(fā)现的应用难题和挑战建设起来的。飞桨(jiǎng)平台在(zài)开发的过程(chéng)中,提供了便捷(jié)的框架,在训(xùn)练过程当中提供了超大规模深度学习模型训练(liàn)技术,在部署上也是针对多端、多平台全面部署的(de)高性(xìng)能的推理引擎,还(hái)有开源模型库,综合提供(gòng)出来供产业(yè)使(shǐ)用。
介绍了算力(lì)、开发框架和平台,再看几大AI算法方(fāng)向(xiàng)上目(mù)前为止(zhǐ)最新的进展(zhǎn)。
首先看一看语音识别方向,语音识别在AI算法(fǎ)当(dāng)中是(shì)发展历史(shǐ)比较悠久,目前也(yě)是(shì)可用性非常高的(de)技术(shù),当然它也(yě)还持续有(yǒu)技术上的(de)突(tū)破(pò)。百度上线了首个基于流(liú)式注意力的语(yǔ)音识别线上服务,这也是在国际上首次(cì)实现在线(xiàn)语音识别中大(dà)规模使(shǐ)用(yòng)注意力(lì)模型。这(zhè)个技(jì)术使用以后,在语音输入法场景下相对准确率有50%的提升,在(zài)音箱这类产品准确率提升到20%。随(suí)着(zhe)端侧智能设备不断广泛使用,离线语(yǔ)音识别在(zài)无网(wǎng)、弱(ruò)网状态有(yǒu)越来(lái)越多(duō)的需(xū)求,百(bǎi)度语音技术(shù)团队通过系统性(xìng)优(yōu)化,解决了语言(yán)模型裁减性能损失问题,使离线模(mó)型(xíng)有非常(cháng)高的识别率。
语音合成方面,如果合成出来的(de)声(shēng)音偏重于机械感,缺少情感,听者在长时间听的情况下会产生疲惫,所以音色(sè)模拟、情感模拟等,都会(huì)是语(yǔ)音合成技术需要(yào)突(tū)破的挑(tiāo)战(zhàn)。百(bǎi)度推出的语音合成技术,可以(yǐ)用(yòng)20句话制作(zuò)专属的(de)定(dìng)制语音(yīn),将声音当中的音(yīn)色、风格(gé)、情感(gǎn)等要素映射到不同的子(zǐ)空(kōng)间,使用的时候不同要素(sù)进行(háng)任意的组合。在百度地图上已(yǐ)经推出了全球(qiú)首(shǒu)个地(dì)图语音(yīn)定制功能,只需(xū)要录制20句(jù)话就可以做成一个个人专属(shǔ)的语音包(bāo)。
视觉(jiào)理解(jiě)方面,这些年在OCR物体检测、视频理解、目标跟踪等业界领先的图像视频技术,百(bǎi)度多次在国内外顶级赛事(shì)中(zhōng)取得佳绩,并且(qiě)在机械制造、金融(róng)、医疗(liáo)、教育等领域得(dé)到非常广泛的(de)使用(yòng)。
虚拟(nǐ)形象合成方面,在对大(dà)量语音(yīn)、视觉以及文本(běn)的理解能(néng)力(lì)达到了非常好的(de)水平(píng)之后(hòu),AI算法也在推进做(zuò)虚拟形(xíng)象合成(chéng),尽可能形成(chéng)更加自然、更(gèng)像真人、更加具有丰富情感(gǎn)的虚拟形象。百度虚(xū)拟形(xíng)象(xiàng)合成技术其实结合了(le)多模态(tài)识别和(hé)理解,语音(yīn)识别、视频理(lǐ)解等等,再加上面部、肢体、嘴形(xíng)的(de)生成能力,还有(yǒu)语音(yīn)合成TTS的技术,实现(xiàn)了业界首个可以进行量(liàng)产视频的真人形象(xiàng)的虚拟(nǐ)主(zhǔ)播,在多个场景当中(zhōng)应用,央视和百度(dù)合作打(dǎ)造(zào)过AI虚拟主持(chí)人小灵,在央视去年的五四晚会(huì)亮相;澎湃新闻和(hé)百度打造了第一个虚拟真人形象的主播,用在早(zǎo)晚(wǎn)新(xīn)闻栏目上;浦发银(yín)行和百度合作打(dǎ)造(zào)了业界(jiè)首个金融数(shù)字人,有情感有专业(yè)的银(yín)行(háng)知识,能够提升银行的客服(fú)体验。
语音、视觉(jiào)等技术(shù)在人工智能技术中属于感知(zhī)层技术(shù),类(lèi)比于人的(de)感知(zhī)能力。人(rén)还(hái)有非常(cháng)强的(de)认知能力,对人工智(zhì)能而言,认知能力主要体现(xiàn)在自然语言处理(lǐ)、知识图谱等语言和知识类技术(shù)上。百度构建了超(chāo)大规模多元异(yì)构知识(shí)图(tú)谱,包括实(shí)体图谱、事(shì)件图谱、行业图谱、关注点图谱、POI图谱(pǔ),这些图谱都会根据需求(qiú)场景需要,不断扩充(chōng)和(hé)延展。
举一个例子,基于知识图谱(pǔ)视频语义理解,从(cóng)视觉视角上提取特征,通(tōng)过语(yǔ)音识别对视频当中(zhōng)人物的(de)对话、言论等等进行语音的识别和提取特(tè)征,还可以对(duì)视频标题以及周边文本进行(háng)文本理解。这些(xiē)基础理解之后,再(zài)结(jié)合(hé)知识(shí)图谱中的(de)视(shì)频理解子图,在知识图谱中进行计算和推理,对(duì)刚刚产生的理(lǐ)解的(de)标签、理(lǐ)解的特征进行补全、关联等(děng)等一(yī)系列操(cāo)作,最终用在产品上(shàng),将会对(duì)整个视频内容有更深度的理解。这是(shì)用感知(zhī)技术(shù)和认知(zhī)技(jì)术进(jìn)行(háng)多模态融合的典型例子。
AI技术(shù)如果能够(gòu)完全、充分理解人的语(yǔ)言(yán),将会是迈向通用人工智能技术非常重要的突破。这(zhè)方面(miàn)百度也持续有新(xīn)的突破。百度推出的ERNIE是(shì)持(chí)续学习的语义理(lǐ)解(jiě)框架,可(kě)以进(jìn)行(háng)增强(qiáng)的语义理(lǐ)解。比如我们想让AI算法理(lǐ)解(jiě)实体,我们会用百(bǎi)科的内容(róng)、网页(yè)内容(róng)进行实体识别任务的构造(zào),然后由预训练(liàn)模型进行学习,再(zài)对(duì)场(chǎng)景上进行针对性(xìng)的fine-tuning,这样(yàng)可以得到实体(tǐ)学习更(gèng)强的(de)语义(yì)理解模(mó)型。再复杂(zá)一(yī)点的(de)任务,比如构建(jiàn)因(yīn)果关系的识别(bié)任(rèn)务,也(yě)是(shì)通过技术方式,构造大量因果的知识,然后由大的预(yù)训(xùn)练模(mó)型进行学(xué)习,再进行任务上的(de)调优(yōu)学习。百度ERNIE模型已经学习了13亿(yì)以上(shàng)的知识,在NLP任务上全面刷(shuā)新了(le)任务效果,目前在共计16个(gè)中英(yīng)文效果上超过了(le)BERT、XLNet,取得了SOTA效果。这张图展示出来的就是不断加以新的知识,让ERNIE在持续学习过程中,推(tuī)动自然语言推断(duàn)、自动问答、文本(běn)相似度、情感分析任务上等等有(yǒu)持续不断的效果(guǒ)提升。
以上(shàng)是AI技术方向最新的进展(zhǎn)概览,百度大脑也打造了完整的AI安全体(tǐ)系,从基础开源技(jì)术矩(jǔ)阵到开放行(háng)业解(jiě)决方案,到与学(xué)术界、企业、政府、机(jī)构等开(kāi)放(fàng)协作(zuò),整个技(jì)术产品已经覆盖(gài)到了(le)云管端,以(yǐ)及大数据、云(yún)计算一(yī)系(xì)列风(fēng)险问题,这样的(de)安全体系也是为AI技术产业应(yīng)用有(yǒu)一(yī)个保驾护航的作用,可(kě)以推(tuī)动AI时代安全生态的建设,让(ràng)大家在使用AI技(jì)术开展(zhǎn)各(gè)种(zhǒng)各(gè)样应用(yòng)创新的时候,没有安(ān)全的后顾之忧。
刚刚(gāng)以百度工作(zuò)为例,详细说明了AI新基建当(dāng)中(zhōng)最基础的技(jì)术(shù)平(píng)台现在的状态,新基建不(bú)仅仅是技术平台,所(suǒ)以接下(xià)来进入今天要分享的第二部分,AI应用价值的创造。
二、AI应用(yòng)价值
百度(dù)AI技术应用在互联网产品当中,也已(yǐ)经有大(dà)量的实践,比如说AI赋(fù)能的智能搜(sōu)索、信息流推荐、新一代人工智能地图等等,以及AI为核(hé)心能力的(de)智能家居小(xiǎo)度系(xì)列产品,还有自动驾驶阿波(bō)罗等等,这(zhè)些百度已有(yǒu)的产品上, AI已经带来了非常多的(de)价值。另一方面(miàn),AI技术其实(shí)也已经体现在面向各行各业的应用价(jià)值了,我今天还想重点分享一(yī)下AI+云赋能产业变革与创新。
先看看这样一个过程。首先我们(men)需要先面对大量数据的生产和数据的应(yīng)用,所(suǒ)以(yǐ)我们在百度智能云上有推出数据工厂,在数据工(gōng)厂当中通(tōng)过数据众(zhòng)包、加工、标注等一系(xì)列工作进行(háng)数据(jù)处理,也结合百度提供的数据集,以及整理的(de)第(dì)三(sān)方行业数据资(zī)源,形成(chéng)基本的数(shù)据集,在应用当中通过数据管理、数据评测的平台等等,使得整(zhěng)个(gè)数据能够(gòu)形成一个闭(bì)环(huán)效应。完整(zhěng)的闭环数据会充分帮助算法达到最佳(jiā)效(xiào)果。数据生产之后会(huì)进入到模型工(gōng)厂,在(zài)AI技术平台支撑下(xià),可以(yǐ)融合算力、数据、算法,结合场景产生模(mó)型,最终应用到业(yè)务系统当中。
我分享一些应用场景的案例。
智能(néng)工(gōng)业巡检。AI应用于智能(néng)工业巡检,在针对场景定(dìng)义的问题上,主(zhǔ)要是(shì)应用图像的分类、分(fèn)割、检(jiǎn)测的(de)方(fāng)法(fǎ),实现快速准(zhǔn)确的识别(bié)。比如(rú)安全(quán)帽佩戴(dài)的检测,尤其(qí)是矿井里的(de)安全帽佩戴检测,烟火(huǒ)的警(jǐng)报,仪器表的读数识别等等,这其中应用(yòng)了AI的算法,相当(dāng)于训练除了有经验的巡检员,可以(yǐ)大幅减少(shǎo)人工(gōng)投(tóu)入,也(yě)降低了(le)人工学(xué)习的(de)成本。
智能质检(jiǎn)。一线质(zhì)检里面工人要进行很长时间工(gōng)作进(jìn)行(háng)零件质检,尤其是精密零件质检,零(líng)件非常小,这些质检工作需要在强光下(xià)进行,长时间(jiān)在强(qiáng)光下看(kàn)微小的瑕疵,容易造(zào)成工人眼睛的疲劳(láo)。案例里的工厂需要每天对出厂的2000多万的产品进行检测工作,质(zhì)检员每天要(yào)检(jiǎn)测多达1万多(duō)个零件,每分钟(zhōng)每个工人需要检测19个,还需要对零件从多个不同的角度的多个缺陷进行分类(lèi)。用AI赋(fù)能(néng)的表(biǎo)面缺陷视觉检测识(shí)别设备,它通过(guò)百(bǎi)度(dù)AI技术和云技术,自动(dòng)对物体表面缺陷(xiàn)进行大小、位置、形状的检测,并按照品质分门别类分好,它总体上可以帮助节省90%的人员成本,整个(gè)设备相比起原来的工作桌,占地面积减少80%,漏检率也大幅度降低(dī)。
这两个都(dōu)是感知层(céng),视觉技术(shù)为(wéi)主的应(yīng)用案例。感知层(céng)技术加上认知(zhī)层技术,就可以在智能媒体上发(fā)挥作用,通过热点(diǎn)发现、智能写(xiě)作、智(zhì)能勘误,以及智能发布(bù)整个全流程,可以助力(lì)新闻的生产全(quán)流程。
今天还(hái)带来了几个在最近(jìn)的抗疫过程当中,给疫情(qíng)的(de)筛查、管理带来帮助的解决(jué)方案。首(shǒu)先(xiān)是AI测温,AI测温是一套可以非接触进行(háng)远(yuǎn)距离多人测温的设备(bèi),现在(zài)也已经在(zài)数百个场(chǎng)所部署(shǔ),帮助全国各(gè)地(dì)完成了700万人次的初(chū)筛工作。AI测温的过程分为几个方(fāng)面,首先在行人路过的时候,通过红外热像仪(yí)能够捕获温(wēn)度,通过光学(xué)相机,摄像头(tóu)能(néng)够(gòu)不间断地对戴口(kǒu)罩的多人进行远(yuǎn)距离的人脸检(jiǎn)测。这套方(fāng)案也在企业内部署,形成企业入场方案,测(cè)温之后还可以(yǐ)进行人脸(liǎn)识别、智能监(jiān)控,并且如果同企业报备系统打通之(zhī)后(hòu),可以自(zì)动识别员工是否符合复工入厂的要求。这里(lǐ)面(miàn)采用的AI技术就是人(rén)脸检(jiǎn)测、跟踪算(suàn)法等,可以(yǐ)精准实现人脸定位,即使戴上口罩,现(xiàn)在也可以(yǐ)进行人脸识别。
在过去的两个月(yuè)大家已经感受到了(le),社区工作者(zhě)在整个抗疫管(guǎn)理中做了非常多的一(yī)线工作,百度推出的基于智能对话技(jì)术的外(wài)呼(hū)系统(tǒng)帮助进(jìn)行人员的随访,能够进行(háng)批量(liàng)的外呼,人工智能语音随访(fǎng)通过自动的外呼系统,触达(dá)到人群,并和他们交(jiāo)流,进行防疫信息采集和疫情防控相关的提醒。这些信息也可以立即形成结构化数据分析报告(gào),支撑后续一系列(liè)的决策或者管理(lǐ)。整个外呼系统应用了语音、自(zì)然语言处理、知识图谱等等(děng)技术。
在(zài)医(yī)护人员最忙碌的时(shí)候,护理信息数(shù)据采集、登记、录(lù)入等等(děng)也是他们每天非常重要的工作,百度和相关的伙伴一起打造了(le)语音临床护理数据采集系统,让护理人员通过(guò)这样(yàng)的设备进行语音录入。医护人员不用摘掉手(shǒu)套、口罩,不(bú)用脱下防护服,可以非常轻松的手(shǒu)持设备进行(háng)语音录入(rù),很快就可以(yǐ)输入大量(liàng)护理信息,并将(jiāng)信息自动上传至医院的电子病历系统。新冠肺炎相对应的(de)临床(chuáng)数据中,有非常多的医疗专(zhuān)用词汇、专业医疗符(fú)号等,我们语音(yīn)系统也(yě)快速(sù)进行了定制训练,在医(yī)护(hù)语音录入场(chǎng)景中语音(yīn)录入准确率可以达到92%以上,这(zhè)套系统(tǒng)已(yǐ)经在烟台市传(chuán)染病医院多个(gè)科室部署使(shǐ)用(yòng)。
病毒分析和疫苗研发也是抗疫工作(zuò)当中非(fēi)常重要的一个工作,在2019年百度曾提出了Linearfold算法,这个(gè)算法(fǎ)可(kě)以将病毒(dú)全基因组RNA二级结(jié)构分析(xī)的时间从55分钟缩短到27秒,大(dà)幅度提升(shēng)RNA二(èr)级结构(gòu)分析的速度。我们知道RNA结构(gòu)分析(xī)在病毒分析和(hé)疫苗研发(fā)当中是(shì)非常重要的,这项工作发表了(le)之后,受到了诸多(duō)业内专家高度的评价,目前也(yě)是在和很(hěn)多机构进行合作(zuò),希望AI算(suàn)法能够助力医学科技。
最后我(wǒ)还想(xiǎng)分享的一个是飞桨和连心医疗开(kāi)源肺炎CT影(yǐng)像分析模型(xíng),能够提(tí)升在肺炎CT影像筛查当中(zhōng)医(yī)护人员的工作效率(lǜ),这个模型本(běn)身病灶检测精度可以达到92%,召回率(lǜ)97%,湘(xiāng)南学(xué)院附属医院(yuàn)在(zài)应(yīng)用当中了。
这些都是AI技术和场景结合之后(hòu)所带(dài)来一系列的价值,这也是我(wǒ)今天分享的第二(èr)部分,就是技(jì)术不断(duàn)的在产生(shēng)应用(yòng)价值,而这些应用价值(zhí)恰恰是作为新基建非(fēi)常重要(yào)的(de)。
三(sān)、AI生态系统
在我们与广大的行业伙(huǒ)伴进行合作过程当中,我(wǒ)们也看到,对于(yú)大量企业来说(shuō),业(yè)务创新(xīn)和应用落地过(guò)程中存在着(zhe)一系(xì)列的挑战。比如说(shuō)研发方面,AI技术(shù)的应用门(mén)槛挺高的,开发周期往往不太可控,有(yǒu)经验的(de)技术(shù)人(rén)员可以开发(fā)周期比较短,但是经验比较缺乏(fá)的研发团队可能(néng)经过较(jiào)长的时间才(cái)能(néng)验证、得到最佳(jiā)的效果。很多企业(yè)在进行了AI加(jiā)持的产品和解决方案研(yán)发之后,也需要有市场营销以及相应的整个过程需要大量的(de)资金投入。我们希望AI技术能(néng)够更(gèng)便利的、方便的被广大企业所使(shǐ)用。
所(suǒ)以百度大脑开(kāi)放平台构建(jiàn)了多层次开放能力(lì)的结构,最基础的(de)有(yǒu)飞(fēi)桨深度学(xué)习(xí)平台,面向(xiàng)场(chǎng)景还有(yǒu)定制(zhì)开发平台以及(jí)开放的能力(lì),以(yǐ)及最后的部署集成的(de)一(yī)套过程。现(xiàn)在在百度大脑开放平台上已经开放(fàng)了248项能力(lì),整个(gè)百度大脑的日(rì)调用量超(chāo)过万亿,在百度(dù)大脑(nǎo)开放(fàng)平(píng)台和飞桨平台上进行开发的开发者(zhě)超过180万,发布模型10多万以上,这(zhè)些模型都在大(dà)量场景(jǐng)中(zhōng)使用(yòng)。AI产业化落地整个链条比较长、比较复杂(zá)、角色很多(duō),整(zhěng)个生态系统中从(cóng)硬件供(gòng)应商到(dào)技术平台、到软件供应、到(dào)应用开(kāi)发、到最后的终端场景,也是多层(céng)、完(wán)整(zhěng)的(de)生态系统,这样一套(tào)AI生态系统也(yě)已经(jīng)形成了,并在基(jī)础设施上不断(duàn)发挥作用。
刚才我介(jiè)绍(shào)的应用(yòng)场景(jǐng)落地的方案,很多都是(shì)在百度大(dà)脑生态系统中研发落地的。
四、AI人才培养(yǎng)
有了技术平台、终端(duān)场景以及生态角色,其实贯(guàn)穿始终(zhōng)的还有非常重要的人(rén)工智能产业智能化相应所需要的人才。AI人才中需要(yào)基础的(de)理论人才、算法人才(cái),在应用落地当中既懂应用(yòng)场景,又懂(dǒng)AI技术(shù)的复合型人才,这(zhè)类(lèi)人(rén)才更加(jiā)重要。大(dà)的技(jì)术平(píng)台型公司中(zhōng)有这类人才,但是想让AI技术和产业广泛结合时,我们(men)会发现这类复(fù)合型人才(cái)更需要各个终端场景以及(jí)我们生态中的(de)各个生态企业不断培养和(hé)积累。技术边界和业务理(lǐ)解本身是存在鸿沟(gōu)的,怎么弥(mí)补(bǔ)鸿沟?就需要复合(hé)型人才来做(zuò)。
所以(yǐ)百度推出了一系列对AI人(rén)才、应用型(xíng)人才的培养计划,我今天介绍其中一个项目(mù),"首(shǒu)席(xí)AI架构师培养计(jì)划"。怎么(me)定义(yì)首席AI架构(gòu)师(shī)?我们认为在企业当中(zhōng),懂自己(jǐ)的业(yè)务场景、懂应(yīng)用当(dāng)中的挑战与难题,又懂(dǒng)AI技术和算法,又同时(shí)能够落(luò)地实施的综合性人才(cái),是企业(yè)当(dāng)中的首席AI架构师。对希望应用AI技(jì)术进(jìn)行智能化转型的(de)企业,这类架构师非常重(chóng)要(yào)。所以我们推出了"黄埔(pǔ)学院"项目,在这个(gè)项目当中有(yǒu)深度学习技术专家进(jìn)行面对面(miàn)深度交流,会有深度学习技术(shù)落地的(de)关键认知传承,会和学员们一(yī)起剖析场景需求(qiú)和(hé)AI技术学习的(de)典(diǎn)型案例,最后总结AI思维(wéi)、学习、工作方案(àn)解决实际场景问(wèn)题,在实际场景当中产生应用价(jià)值(zhí)。
今天分享(xiǎng)的(de)主要(yào)是四(sì)个部分(fèn)内容,最后用一页进行一个小结。
1. AI基础设施是构(gòu)建于云(yún)平台基础上,以算力平台和(hé)数(shù)据(jù)平台支撑形成(chéng)的AI技术开发平(píng)台、能力(lì)平(píng)台、场景技术方案综合的(de)、具备(bèi)AI安全保障(zhàng)能力的大型技术系(xì)统(tǒng)和工程系统。
2.在基础设施之上(shàng),要不断(duàn)在应用场景当中发挥应用价值(zhí),以此形成正向(xiàng)的循环(huán),能够促进基础平台进一步发展,促进整个(gè)AI系统进一步进化。
3. 在AI产业(yè)化过(guò)程当中,因为其过(guò)程链条(tiáo)长、决策复杂,需要(yào)社会全方位多方整(zhěng)合力量进行积木(mù)式(shì)创新,因此共生共赢的生(shēng)态系统就(jiù)应运而生了。
4.还要重视人才培养,加大(dà)力度培养既懂应用(yòng)场景(jǐng),又懂AI技术的复合型新型(xíng)人才,通过构(gòu)建(jiàn)相(xiàng)应的(de)教(jiāo)育、培训(xùn)体系(xì)以及职业体(tǐ)系保障(zhàng),多方(fāng)位培养AI技(jì)术及应用人才。
综合四方面(miàn),是基于AI新型基础设(shè)施(shī)加速产业(yè)智能化需发展(zhǎn)的(de)几个重要方向。