[发明专利]一种语音文件查询方法和装置有效
申请号: | 201410024095.0 | 申请日: | 2014-01-20 |
公开(公告)号: | CN104142974A | 公开(公告)日: | 2014-11-12 |
发明(设计)人: | 李露;马建雄;卢鲤 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 阎敏;宋志强 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 文件 查询 方法 装置 | ||
1.一种语音文件查询方法,其特征在于,所述方法包括:
将每个目标语音文件分别转换成对应的目标音节混淆网络;
将待查询语音文件或待查询文本转换成对应的待查询音节混淆网络;
计算所述待查询音节混淆网络与各个目标音节混淆网络的相似度,获取相似度最高的一个以上目标音节混淆网络所对应的目标语音文件。
2.根据权利要求1所述的方法,其特征在于,所述将目标语音文件转换成对应的目标音节混淆网络、或者将待查询语音文件转换成对应的待查询音节混淆网络的方式为:
利用音节解码器对所述目标语音文件或待查询语音文件进行解码,得到中间结果;利用框架Lattice转换工具对所述中间结果进行转换,得到对应的音节混淆网络。
3.根据权利要求1所述的方法,其特征在于,所述将待查询文本转换成对应的待查询音节混淆网络的方式为:
将所述待查询文本划分为多个词;
查找所述各个词对应的音节;
将查找到的音节串联,得到音节序列y1、y2、……、ym,其中,m为音节的个数,yi(i=1、2、……、m)为音节;
构造初始节点V0和结束节点Vm+2;并构造(m+1)个中间节点,包括V1、V2、……、Vm+1;
构造V0与V1的之间的一条边,将该边的音节标签设置为空标签!NULL,将该边的权重设置为1;构造Vm+1与Vm+2的之间的一条边,将该边的音节标签设置为!NULL,将该边的权重设置为1;依次针对两个相邻的中间节点Vi与Vi+1(i=1,2,……,m)构造一条边,将各条边的音节标签分别设置为y1、y2、……、ym,将每条边的权重均设置为1。
4.根据权利要求1所述的方法,其特征在于,所述将每个目标语音文件分别转换成对应的目标音节混淆网络之后进一步包括,建立所有目标音节混淆网络的索引,包括正排索引和倒排索引;
所述正排索引包括各个目标音节混淆网络与音节混淆网络标识的对应关系;
所述倒排索引包括:目标音节混淆网络中的各个音节所属的目标音节混淆网络的音节混淆网络标识、以及该音节所对应的边的权重。
5.根据权利要求4所述的方法,其特征在于,所述计算待查询音节混淆网络与各个目标音节混淆网络的相似度的方式为:
查询所述所有目标音节混淆网络的索引,确定包含所述待查询音节混淆网络中所有音节的目标音节混淆网络;根据待查询音节混淆网络生成对应的状态转移查询表,采用所述状态转移查询表计算待查询音节混淆网络与所述确定出的各个目标音节混淆网络的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410024095.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种实现RFID标签存储管理的索引方法
- 下一篇:运营管控系统及方法