自动(dòng)驾驶(shǐ)汽车和机器人领域的传感器(qì)和摄像(xiàng)头(tóu)套件,已经能够对周(zhōu)围(wéi)环境产生积极的识别检测(cè)。 不过近日,佐(zuǒ)治亚大(dà)学(xué)人工智能研究(jiū)所的 Jagadish K. Mahendran 和他的研究团(tuán)队,还为视力障(zhàng)碍人(rén)士设计了一款“导航背包”。 其作为一(yī)款(kuǎn) AI 驱(qū)动(dòng)、语音激活的低功耗(hào)交互式(shì)设(shè)备,它(tā)能(néng)够(gòu)帮助用户应付常见的出行挑战。
(视频截图 viaIntel)
据悉,这套视觉辅助系(xì)统由一(yī)件(jiàn)背包(bāo)(或背(bèi)心)、以及一副耳机组成(chéng)。 4K 摄(shè)像头(tóu)能够采集外(wài)界颜(yán)色,而一对深度(dù)传感器能够采集 3D 信息。
在将视(shì)觉(jiào)信息送入背包中(zhōng)的“大脑(nǎo)”之后(笔(bǐ)记本电脑或树莓派计算机(jī)),系统可借助一(yī)个通(tōng)过 USB 连接的 GPS 组(zǔ)件、OAK-D 接口、Open CV 软件、以及神(shén)经网络来解析可(kě)视(shì)数据。
除了长达 8 小时的续航时间,“隐匿性”也是此设备(bèi)的一个重要因素,从视频演示画面来看,它能够让(ràng)穿戴者像常人一样在大街上走(zǒu)动,而不会(huì)像一(yī)台机器(qì)人(rén)那样惹人注目(mù)。
处理完成(chéng)后,系统可通过(guò)蓝牙向用户传(chuán)输导航信息,以警告类型和大(dà)小不(bú)尽相同的障(zhàng)碍物,并使用(yòng)简(jiǎn)洁的语言来描述该规(guī)避的相对(duì)方位(wèi)(比如上(shàng)、下、左(zuǒ)、右、中(zhōng)心)。
Visual Assistance System for the Visually Impaired( via )
由视频可知,这套背包(bāo) AI 导航系统能(néng)够分(fèn)辨垃圾桶(tǒng)、有较(jiào)高(gāo)落差(chà)的阶(jiē)梯等对象、以及一(yī)些重要的标(biāo)识牌(比如停车避让)。此外在接近道(dào)路拐角(jiǎo)时,系统也能够及时(shí)发出(chū)语音提(tí)醒。
此外系(xì)统还支持更多的(de)语音命令交互(hù),比如描述 10 点(diǎn)钟方向的汽车、12 点钟方向的行人、1 点钟方向的交通灯,或者要求保存当前位置、以及导航至 咖啡 馆等特定地点。
最后,尽管仍处于早(zǎo)期阶段,研究团队还是尽快将之推(tuī)向开源和非商(shāng)业化的应用(yòng),以(yǐ)推(tuī)动相关技术的快速发(fā)展。