由声智科技研(yán)发的“AI数字人(rén)垃圾分类管家”融(róng)合了人(rén)脸识别、智能语音(yīn)交互、行为(wéi)识别等技术,使垃圾分(fèn)类管理更加方便快速。
一台可以书写的智能交互机械臂,用毛笔写下(xià)“一起向(xiàng)未来”;一(yī)部(bù)多足行走机(jī)器(qì)人(rén)和一(yī)部跳舞机(jī)器人,共同跳起了一段舞蹈,随后,跳舞机(jī)器人还单独进行(háng)了一段武术表演,抱拳开臂,马(mǎ)步(bù)弓步,一招一式憨态可掬。这是记(jì)者在北京声智科技有限公司(以下称“声智(zhì)科技”)展(zhǎn)厅里看到的景(jǐng)象。
声智科技(jì)成立于2016年(nián),专注于声学前(qián)沿技术(shù)和人(rén)工智能领域,主(zhǔ)要面向数智健(jiàn)康、数智城市等场景提供产(chǎn)品和解决方案。凭借持(chí)续创新研发,声智科技获得了(le)吴文(wén)俊人工智(zhì)能科学技术奖、北京市科(kē)技(jì)进步二等奖等多个奖项。
突(tū)破技术难(nán)点
“声(shēng)智科(kē)技是(shì)从研发远场语音交(jiāo)互技术起步的,你刚才看到的那几个智能(néng)机(jī)器(qì)人(rén)搭(dā)载(zǎi)了声智科技研发的(de)智能语音交互技(jì)术。”声智科技创始(shǐ)人(rén)陈孝良(liáng)说,随着物联(lián)网技术的普及,语音成(chéng)为人机交(jiāo)互(hù)的新入口,支持远场语音交互的(de)产品市场潜力很大。
“远场语音(yīn)识别技术(shù)面临诸多(duō)研发难点,比(bǐ)如(rú)环境噪声、人声、房间混响(xiǎng)的(de)干(gàn)扰(rǎo)等。若采用常(cháng)规语(yǔ)音处理(lǐ)方法,会(huì)导致信(xìn)号失真和(hé)资(zī)源消耗(hào)大,使得语音(yīn)识别技术准确率低,应用困难。”陈孝良说。
凭(píng)借深(shēn)厚技术(shù)积(jī)累和持续研发(fā),声(shēng)智科(kē)技先后(hòu)攻(gōng)克了多项远(yuǎn)场语音交互(hù)关键技术,包括回声抵消技术、噪声消除技术、声源定(dìng)位技术、语音识(shí)别技术等(děng)。如今,这些技术已应(yīng)用于一(yī)些(xiē)消费(fèi)级电子产品中,声(shēng)智(zhì)科技也成为国内不少知名企业的(de)合作伙伴。
“我们(men)意(yì)识到,伴随(suí)着人工智能(néng)的快速(sù)发展,人(rén)机交互、协同过程中的多数问题,都不能靠单一技术解(jiě)决,需要将语音、图像识别、大(dà)数据等技术结合(hé)起来。只(zhī)有推进多(duō)模态(tài)、多技能的(de)融合,才能实现更多场(chǎng)景的应用(yòng)。”声智科技(jì)副总(zǒng)裁李良(liáng)斌说。
他介绍,声智科技的做法(fǎ)是,用“多模态(tài)”确保机器具(jù)有“声、光、电、热、力(lì)、磁”多种感知技术(shù);用“远场(chǎng)”解决机器(qì)在远(yuǎn)距离(lí)场域(yù)中对(duì)多模态信号(hào)的分析(xī);用“多技能”赋予智能系统(tǒng)多种能力,通过多技能相(xiàng)互协(xié)同,完成复杂任务。
基(jī)于(yú)这(zhè)种技术(shù)理念,声智科技(jì)研发推出(chū)核心技术产品——壹(yī)元(yuán)人工(gōng)智能开发框架。基(jī)于这(zhè)个框架,声(shēng)智科技(jì)融合了远场声光、多模态(tài)识(shí)别等多项技术,围绕智慧(huì)社(shè)区、智慧交通、智慧办公(gōng)、智慧医院等应用场景,提供AI产品及解决方案。
截至(zhì)目前,声智科技已经参与了50余项国家行业标(biāo)准的制定,拥(yōng)有国内(nèi)专利2000余项(xiàng)。在2020年前,声智科技总融资金额超过3亿元。陈孝良说,这些融资全部投(tóu)入到核(hé)心技术(shù)的(de)持(chí)续研(yán)发(fā)上(shàng)。
助力智慧防疫(yì)
新(xīn)冠肺炎疫情暴发以(yǐ)来(lái),声(shēng)智科技自主(zhǔ)研发的技(jì)术(shù)产品,用于(yú)多(duō)地的(de)防(fáng)疫服务中。
记者刚走进中关村前沿技(jì)术创新(xīn)中心(xīn)的(de)一楼大厅,就(jiù)听到(dào)清脆(cuì)的(de)声(shēng)音:“您现在的体温是36.5摄氏度,没有(yǒu)发热症状”。声(shēng)音来(lái)自一台测温机器人,在(zài)机器(qì)人显示(shì)屏上,除了实时显(xiǎn)示被检测者(zhě)的红外热成(chéng)像信息和温度值,还能查看全国疫情数(shù)据(jù),测(cè)温精度(dù)在正负0.2摄氏度。
声(shēng)智科(kē)技首席知识(shí)官常(cháng)乐介绍,这个测温机器(qì)人(rén)可在几秒(miǎo)钟内完成1米至6米范(fàn)围内多个目标的高精度测温,支持(chí)实时AI语(yǔ)音(yīn)合(hé)成播报(bào),自动上传预警信息。目前,该机器人已在北京、广州、青岛、成都等地落地使用。
“小易小易(yì),上楼”“小易(yì)小易(yì),去(qù)10楼”,在北京(jīng)海淀医院的电梯里,只需要一(yī)句简单的(de)指令(lìng),就能实现乘(chéng)梯上下楼,全程免按(àn)键,实现零接触。
“声智(zhì)科技研(yán)发的智慧语音电梯,融(róng)合语(yǔ)音与图像等交互技术,不依赖手机(jī)、IC卡等设备(bèi),无论使(shǐ)用者是在电梯外,还是在电(diàn)梯轿厢内,都(dōu)可以通过(guò)可视化(huà)人机(jī)交互方式搭乘电梯。”常乐介绍,这方(fāng)便了老人、儿童(tóng)等用户(hù)的日常(cháng)生活,在疫情(qíng)防控期间还有效降低了接触传(chuán)播(bō)感染风险(xiǎn)。
目前,声智(zhì)科(kē)技(jì)已推出(chū)第(dì)二代AI智能电(diàn)梯系(xì)统,增(zēng)加手(shǒu)势识别功能,残障人士也(yě)可以实(shí)现免接触控(kòng)制电梯。2021年,为解决电动自行车入户充电(diàn)的(de)监(jiān)管(guǎn)难题,减少电池充(chōng)电爆炸起火(huǒ)等隐患,企业又迭代推出了第三代AI智能(néng)电梯。
“未(wèi)来,我(wǒ)们希望AI技术(shù)能满足复杂场景的灵(líng)活、大范围应用(yòng)。”李良斌表示,声智科技将继(jì)续加强核心(xīn)技术(shù)研发,让更多(duō)AI产品落地(dì),使万物互联更智能。