[发明专利]用于校正文本的方法和系统在审
申请号: | 201210375808.9 | 申请日: | 2012-09-29 |
公开(公告)号: | CN103714048A | 公开(公告)日: | 2014-04-09 |
发明(设计)人: | 张世磊;刘文;包胜华;陈健;施琴;苏中;秦勇 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邸万奎 |
地址: | 美国纽*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 校正 文本 方法 系统 | ||
1.一种用于校正文本的方法,包括:
确定一个文本中要校正的目标文本单元;
接收用户针对所述目标文本单元输入的参考语音片段;
根据所述参考语音识别片段,确定与所述目标文本单元中的字发音相似的参考文本单元;
用所述参考文本单元校正所述文本中的所述目标文本单元中的字。
2.如权利要求1所述的方法,其中,所述文本是语音数据的识别文本。
3.如权利要求1所述的方法,其中,根据所述参考语音片段,确定与所述目标文本单元的字发音相似的参考文本单元包括:
对所述参考语音片段进行语音识别,以获得参考文本片段;
确定所述参考文本片段中与所述目标文本单元中的字发音相似的参考文本单元。
4.如权利要求3所述的方法,确定所述参考文本片段中与所述目标文本单元中的字发音相似的参考文本单元包括:
解析所述参考文本片段对应的音素以及所述目标文本单元对应的音素;
基于音素相似度,确定所述参考文本片段中与所述目标文本单元中的字发音相似的参考文本单元。
5.如权利要求1所述的方法,其中,根据所述参考语音片段,确定与所述目标文本单元的字发音相似的参考文本单元包括:
对所述参考语音片段进行语音识别,以获得参考文本片段;
基于发音相似性,确定所述参考语音片段中与所述目标文本单元中的字发音相似的语音子片段;
从所述参考文本片段中获得对应于所述语音子片段的参考文本单元。
6.如权利要求1至5中任何一个所述的方法,其中,所确定的参考文本单元为多个参考文本单元,其中,用所述参考文本单元校正所述文本中的所述目标文本单元中的字进一步包括:
接收用户对于所述多个参考文本单元中的一个的选择,用于校正所述目标文本单元中的至少一个字。
7.如权利要求1至5中任何一个所述的方法,其中,所确定的参考文本单元为多个参考文本单元,其中,用所述参考文本单元校正所述文本中的所述目标文本单元中的字进一步包括:
根据所述多个参考文本单元的置信度,选择用于校正所述目标文本单元中的字的参考文本单元。
8.如权利要求1所述的方法,进一步包括:识别所述文本的文本单元的单元边界。
9.如权利要求1所述的方法,其中,确定所述文本中要校正的目标文本单元包括:接收用户对于所述文本中的文本单元的选择,以确定要校正的目标文本单元。
10.如权利要求2所述的方法,其中,确定所述文本中要校正的目标文本单元包括:
获得所述语音数据的识别文本中的文本单元的置信度;以及
根据所述置信度确定要校正的目标文本单元。
11.一种用于校正文本的系统,包括:
目标文本单元确定装置,被配置为确定一个文本中要校正的目标文本单元;
参考语音片段接收装置,被配置为接收用户针对所述目标文本单元输入的参考语音片段;
参考文本单元确定装置,被配置为根据所述参考语音片段,确定与所述目标文本单元中的字发音相似的参考文本单元;
目标文本单元校正装置,被配置为用所述参考文本单元校正所述文本中的所述目标文本单元中的字。
12.如权利要求11所述的系统,其中,所述文本是语音数据的识别文本。
13.如权利要求11所述的系统,其中,参考文本单元确定装置包括:
语音识别装置,被配置为对所述参考语音片段进行语音识别,以获得参考文本片段,
其中,参考文本单元确定装置进一步被配置为确定所述参考文本片段中与所述目标文本单元中的字发音相似的参考文本单元。
14.如权利要求13所述的系统,参考文本单元确定装置进一步包括:
音素解析装置,被配置为解析所述参考文本片段对应的音素以及所述目标文本单元对应的音素;
其中,参考文本单元确定装置进一步被配置为基于音素相似度,确定所述参考文本片段中与所述目标文本单元中的字发音相似的参考文本单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210375808.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:操盘器
- 下一篇:基于物联网的数据转换装置