专利名称 | 一种发音稳定段辅助的语音识别优化解码方法及装置 | 申请号 | CN201210514763.9 | 专利类型 | 发明专利 | 公开(公告)号 | CN103021408A | 公开(授权)日 | 2013.04.03 | 申请(专利权)人 | 中国科学院自动化研究所 | 发明(设计)人 | 刘文举;杨占磊 | 主分类号 | G10L15/14(2006.01)I | IPC主分类号 | G10L15/14(2006.01)I;G10L19/02(2013.01)I | 专利有效期 | 一种发音稳定段辅助的语音识别优化解码方法及装置 至一种发音稳定段辅助的语音识别优化解码方法及装置 | 法律状态 | 实质审查的生效 | 说明书摘要 | 本发明公开了一种基于发音稳定段的语音识别解码方法。针对语音识别解码过程复杂度较高的问题,本发明提出利用语音的稳定性信息改善解码过程中路径扩展的方式,达到降低解码复杂度的目的。本发明的方案包括下列步骤:对语音信号计算语谱图;计算语音信号的分频带能量及其变化率;定位语音信号中能量发生跳变的时间点;获取语音的发音稳定段;根据解码过程中路径扩展发生的位置,将扩展划分为隐马尔科夫模型之间的扩展,以及隐马尔科夫模型内部各状态间的扩展两类;跟踪语音识别解码过程,定位隐马尔科夫模型之间的扩展;在发音稳定段,删除原解码框架下的隐马尔科夫模型之间的扩展,只允许路径在隐马尔科夫模型内部各状态间进行扩展。 |
1、源头对接,价格透明
2、平台验证,实名审核
3、合同监控,代办手续
4、专员跟进,交易保障