[发明专利]从概率输入识别准确转录有效
申请号: | 201910480285.6 | 申请日: | 2019-06-04 |
公开(公告)号: | CN110598201B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | G.卡内瓦莱;M.詹菲科;C.拉古萨;R.拉古萨 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/30;G06N3/126 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邸万奎 |
地址: | 美国纽*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 概率 输入 识别 准确 转录 | ||
1.一种识别句子的准确转录的方法,该方法包括以下步骤:
计算机确定句子的单词中所包括的每个单词的转录的多个选项,所述句子最初作为书面文本或语音被接收;
计算机确定选项的概率分数,所述概率分数指示多个选项是每个单词的准确转录的相应可能性;
计算机通过使用由硬件随机数生成器或伪随机数生成器生成的数字,从每个单词的转录的多个选项当中进行选择来生成句子的转录的变体,所述选择由所述概率分数加权;
计算机通过执行所述变体的句法、语义和冗余分析来生成变体的似真分数,所述似真分数指示变体是似真句子的相应可能性;以及
基于似真分数、概率分数和变体,计算机通过对变体采用遗传进化技术重复确定和精炼句子的暂定转录,直到最终的精炼暂定转录是句子的准确转录。
2.根据权利要求1所述的方法,其中确定和精炼暂定转录的步骤包括以下步骤:
基于似真分数,计算机将变体划分为互斥的第一组变体和第二组变体,所述第一组指示比由所述第二组指示的任何句子更似真的句子;
计算机丢弃所述第二组;
计算机从所述第一组中的变体生成第一父代变体和第二父代变体的配对,所述配对通过使用由硬件随机数生成器或伪随机数生成器生成的数字而生成;
计算机通过从每一配对生成两个子代变体来生成子代变体,其中每个子代变体中的单词从第一父代变体继承,从第二父代变体继承,或者通过使用硬件随机数生成器或伪随机数生成器基于所述概率分数从单词的转录的多个选项中随机选择;
计算机确定子代变体的似真分数;
计算机将子代变体添加到所述第一组变体以创建新一组的变体;以及
计算机将所述新一组的变体中的变体识别为具有最大似真分数的变体,并且基于所识别的具有最大似真分数的变体,计算机确定所识别的变体是句子的暂定转录。
3.根据权利要求2所述的方法,还包括以下步骤:
计算机确定所述暂定转录不是句子的准确转录;
基于所述暂定转录不是句子的准确转录,计算机通过重复以下步骤来精炼句子的暂定转录:划分变体,丢弃第二组,生成配对,生成子代变体,确定子代变体的似真分数,将子代变体添加到第一组,识别变体,以及确定所识别的变体是句子的暂定转录;以及
响应于执行预定次数的重复步骤或者句子的精炼暂定转录相对于先前的精炼暂定转录的改进没有达超过预定阈值的量,计算机确定句子的精炼暂定转录是最终的精炼暂定转录;和
计算机将所述最终的精炼暂定转录呈现为句子的准确转录。
4.根据权利要求1所述的方法,其中执行变体的句法、语义和冗余分析的步骤包括以下步骤:
计算机生成指示变体的句法满足语法规则的度量的第一分数;
计算机生成指示变体片段与文档语料库中包括的片段匹配的频率的第二分数;以及
计算机基于由变体指示的句子中不同单词的数量与由变体指示的句子中单词的总数的比率生成第三分数,其中生成变体的似真分数的步骤包括通过将包括在所述第一分数、第二分数和第三分数中的分数相加来生成每个似真分数。
5.根据权利要求1所述的方法,其中执行变体的句法、语义和冗余分析的步骤包括计算机通过以下步骤执行变体中包括的第一变体的冗余分析的步骤:
确定由第一变体指示的句子中不同单词的数量d;
确定由第一变体指示的句子中单词的总数t;以及
通过计算来确定第一变体的冗余分数。
6.根据权利要求5所述的方法,还包括以下步骤:
计算机确定变体中包括的第二变体的冗余分数;
计算机确定第一变体的冗余分数大于第二变体的冗余分数;以及
基于第一变体的冗余分数大于第二变体的冗余分数,计算机确定第一变体比第二变体更有可能是句子的准确转录。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910480285.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:语义识别方法及装置
- 下一篇:一种小学语文作文排比句自动识别的方法