专利名称 | 基于循环神经网络语音识别中语音数据增强方法及装置 | 申请号 | CN201710651866.2 | 专利类型 | 发明专利 | 公开(公告)号 | CN107437417A | 公开(授权)日 | 2017.12.05 | 申请(专利权)人 | 中国科学院自动化研究所 | 发明(设计)人 | 赵媛媛;徐爽;徐波 | 主分类号 | G10L15/16(2006.01)I | IPC主分类号 | G10L15/16(2006.01)I;G10L15/06(2013.01)I;G10L15/02(2006.01)I;G10L15/20(2006.01)I | 专利有效期 | 基于循环神经网络语音识别中语音数据增强方法及装置 至基于循环神经网络语音识别中语音数据增强方法及装置 | 法律状态 | 实质审查的生效 | 说明书摘要 | 本发明涉及语音识别处理领域,提出了一种基于循环神经网络的语音数据增强的方法,旨在解决循环神经网络在语音识别中由于模拟语音识别中不规则语法现象引起的过度建模词间依赖的问题。该方法包括:从输入的语音数据中提取标识语音的各个频率能量值的声学特征,生成声学特征向量;根据预设的标注文件和声学特征向量获得语音数据的语句标签序列;通过决策聚类预设的标注文件和语句标签序列获得决策聚类操作后的对齐文件;生成一个[0,1]之间的第一随机数γ,并与预设的调整比例α比较;如果第一随机数γ大于调整比例α,在边界文件所指示的位置对上述语音数据进行增强处理。该方法够快速、方便地增加训练数据中不规则的口语化现象。 |
1、源头对接,价格透明
2、平台验证,实名审核
3、合同监控,代办手续
4、专员跟进,交易保障