[发明专利]用于校正文本的方法和系统在审
申请号: | 201210375808.9 | 申请日: | 2012-09-29 |
公开(公告)号: | CN103714048A | 公开(公告)日: | 2014-04-09 |
发明(设计)人: | 张世磊;刘文;包胜华;陈健;施琴;苏中;秦勇 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邸万奎 |
地址: | 美国纽*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 校正 文本 方法 系统 | ||
技术领域
本发明涉及语音处理,更具体地,涉及一种用于利用语音处理来校正文本的方法和系统。
背景技术
目前,随着信息技术的快速发展,语音应用正越来越受到工业以及学术界的关注。语音应用使得用户能够采用语音搜索因特网,或在便携式设备上用语音进行记录。
虽然目前的语音识别技术的准确率已经大大提高,但受各种因素的影响,所返回结果的准确性仍然远远不够。用户不得不手动地修改识别结果,例如,如果需要改正一个字,用户必须双击这个字,采用文本输入法输入正确的字,这个繁复的过程会降低用户对于使用语音软件的兴趣。一般来说,错误往往发生在词汇表之外的字上或者一些专用字词上。因此,希望提供一种方便用户校正语音识别文本错误的方案。
发明内容
考虑到语音识别过程中,出现的大量错误是同音异义字,或者发音相近的字,本发明提出了一种基于语音处理的校正文本的方法和系统。
根据本发明的一个方面,提供了一种用于校正文本的方法,包括,确定一个文本中要校正的目标文本单元;接收用户针对所述目标文本单元输入的参考语音片段;根据所述参考语音片段,确定与所述目标文本单元中的字发音相似的参考文本单元;用所述参考文本单元校正所述文本中的所述目标文本单元中的字。
根据本发明的另一个方面,还提供了一种用于校正文本的系统,包括:被配置为确定一个文本中要校正的目标文本单元的装置;被配置为接收用户针对所述目标文本单元输入的参考语音片段的装置;被配置为根据所述参考语音片段,确定与所述目标文本单元中的字发音相似的参考文本单元的装置;被配置为用所述参考文本单元校正所述文本中的所述目标文本单元中的字的装置。
通过本发明,可以使得用户能够容易地校正文本中的错误。
附图说明
通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。
图1示出了适于用来实现本发明实施方式的示例性计算系统100的框图。
图2显示了根据本发明的一个实施例的用于校正文本的方法的流程图。
图3显示了根据本发明的另一个实施例的用于校正文本的方法的流程图。
图4显示了根据本发明的另一个实施例的用于校正文本的方法的流程图。
图5显示了根据本发明的一个实施例的用于校正文本的系统的方框图。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
所属技术领域的技术人员知道,本发明可以实现为系统、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:可以是完全的硬件、也可以是完全的软件(包括固件、驻留软件、微代码等),还可以是硬件和软件结合的形式,本文一般称为“电路”、“模块”或“系统”。此外,在一些实施例中,本发明还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210375808.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:操盘器
- 下一篇:基于物联网的数据转换装置