近日(rì),阿里巴(bā)巴公(gōng)开一项“语音识别方(fāng)法及(jí)装置”相关(guān)专利(lì),该(gāi)专利于(yú)2019年(nián)7月4日申请,2021年1月22日公开(kāi),公开号为CN112259089A。
根据专(zhuān)利摘要,本申请实施例提供了一种语音识别方(fāng)法及装(zhuāng)置,涉及人工智能领域。其中,所述方法包括:获(huò)取第一音频样本的音(yīn)频数据帧与第(dì)一音频样本对应的文本标注数(shù)据的上下文相关音素的第一强制对齐结果;基于第(dì)一强(qiáng)制对齐结果(guǒ),确定第一音(yīn)频样本的(de)音频数(shù)据(jù)帧关于(yú)待训练的唤醒声学模型的音素标注数据;基于音素标注数据(jù),对待训练的唤醒声学模型进行训练,其中,唤醒声学模型的输出层(céng)中设置(zhì)有针(zhēn)对唤醒词的唤醒词相关输出部分(fèn)和(hé)唤醒词无关输出部分。
通过本申请实(shí)施例,使得训练后的唤(huàn)醒声学模(mó)型在(zài)兼顾语(yǔ)音(yīn)唤醒性能的同时,能够有效降低(dī)对设(shè)备端的(de)计算(suàn)资源的使用。
阿(ā)里巴巴的这项专利很有可能用在智能(néng)设备上,如智能音响。2017年7月5日,阿里巴巴集(jí)团阿里云智能事业(yè)群推出AI智能终(zhōng)端品牌——天猫精(jīng)灵,让用户以自然语言对话的(de)交互方式,实现(xiàn)影音娱乐、购物、信(xìn)息查(chá)询、生活服务(wù)等功能操作,成为作为(wéi)消费(fèi)者的家庭助(zhù)手。
去(qù)年5月,在天猫精灵发布会上,提出(chū)了“双百(bǎi)计(jì)划”,即(jí)将投入 100亿(yì)元(yuán)进行生态建设,与合作伙(huǒ)伴共同推出 100 款千万级智能产品。