| 专利名称 | 用于语音识别的声学模型的建模方法、建模系统 | 申请号 | CN201310020010.7 | 专利类型 | 发明专利 | 公开(公告)号 | CN103117060A | 公开(授权)日 | 2013.05.22 | 申请(专利权)人 | 中国科学院声学研究所;北京中科信利技术有限公司 | 发明(设计)人 | 颜永红;肖业鸣;潘接林 | 主分类号 | G10L15/14(2006.01)I | IPC主分类号 | G10L15/14(2006.01)I;G10L15/06(2013.01)I | 专利有效期 | 用于语音识别的声学模型的建模方法、建模系统 至用于语音识别的声学模型的建模方法、建模系统 | 法律状态 | 公开 | 说明书摘要 | 本发明涉及一种用于语音识别的声学模型的建模方法及语音识别系统。所述方法包括:训练一个初始模型,建模单元为经音素决策树聚类后的三音子状态,所述模型还给出状态转移概率;基于初始模型对训练数据语音特征的三音子状态进行强制对齐,获得其帧级别的状态信息;对深层神经网络进行预训练以得到各隐含层初始权重;基于所获得的帧级状态信息采用误差反向传播算法对已初始化的网络进行训练,更新权重。本发明采用上下文相关三音子状态做为建模单元,基于深层神经网络建模,使用受限波尔兹曼算法初始化所述网络各隐含层的权重,所述权重在后续还可以借助反向误差传播算法被更新,能够有效地缓解所述网络预训练时容易陷入局部极值的风险,并进一步提高声学模型的建模精度。 |
1、源头对接,价格透明
2、平台验证,实名审核
3、合同监控,代办手续
4、专员跟进,交易保障