专利名称 | 音频编辑系统和音频编辑方法 | 申请号 | CN201010614165.X | 专利类型 | 发明专利 | 公开(公告)号 | CN102543080A | 公开(授权)日 | 2012.07.04 | 申请(专利权)人 | 索尼公司;中国科学院声学研究所 | 发明(设计)人 | 卢鲤;赵庆卫;颜永红;刘昆;吴伟国 | 主分类号 | G10L15/14(2006.01)I | IPC主分类号 | G10L15/14(2006.01)I;G10L15/02(2006.01)I;G10L15/06(2006.01)I | 专利有效期 | 音频编辑系统和音频编辑方法 至音频编辑系统和音频编辑方法 | 法律状态 | 实质审查的生效 | 说明书摘要 | 音频编辑系统包括:多个初始切分装置,分别将来自多个声道的音频流初始切分为多个不同的段落;多声道融合装置,对多个初始切分装置的切分点进行综合,并从每两个相邻的切分点之间选择最优的声道的音频流,从而得到多个初始切分片段,并且将得到的多个初始切分片段融合形成统一音频数据文件;音频聚类装置,基于层次聚类的算法,对多个初始切分片段进行有监督聚类,将属于同一性质的初始切分片段聚成一个类别;重新切分装置,利用音频聚类装置聚类的结果,训练得到每个类别相应的隐马尔科夫模型,并对统一音频文件进行维特比对齐切分,得到重新切分后的音频流。通过以上高精度的说话人切分系统,能够提高最终说话人聚类的准确性。 |
1、源头对接,价格透明
2、平台验证,实名审核
3、合同监控,代办手续
4、专员跟进,交易保障