[发明专利]零代词的恢复和解析在审

专利信息
申请号: 202080037806.1 申请日: 2020-09-04
公开(公告)号: CN114175040A 公开(公告)日: 2022-03-11
发明(设计)人: 宋林峰 申请(专利权)人: 腾讯美国有限责任公司
主分类号: G06F40/00 分类号: G06F40/00
代理公司: 深圳市深佳知识产权代理事务所(普通合伙) 44285 代理人: 林志鹏
地址: 美国加利福尼亚州*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 代词 恢复 解析
【说明书】:

提供了用于恢复被省略的代词的方法、计算机程序和计算机系统。该方法、计算机程序和计算机系统涉及接收与一个或更多个输入字对应的数据并确定接收到的输入字数据的上下文表示。可以基于与上下文表示相关联的概率值来确认被省略的代词,并且可以确定与接收到的输入字中的一个或更多个相关联的跨度。跨度可以对应于输入字中的由被省略的代词指代的输入字。

相关申请的交叉引用

本申请要求于2019年12月5日在美国专利商标局提交的美国专利申请第16/704,241号的优先权,其全部公开内容通过引用整体并入本文中。

背景技术

本公开内容一般地涉及计算领域,更具体地,涉及自然语言处理。

全世界的许多语言都从句子中省略了主语代词。虽然在诸如英语的非代词省略(non-pro-drop)语言中很少省略主语代词,但代词省略(pro-drop)在诸如汉语的其他语言中经常出现,其中,高达30%的主语代词可能被省略。对于这些语言,省略的代词或零代词可能对应于根据上下文可以容易地推断的句子主语。在这些情况下,在不会给人类听众带来歧义时,为了简洁性和效率性可以省略主语。

发明内容

实施方式涉及用于恢复省略的代词的方法、系统和计算机可读介质。根据一个方面,提供了用于恢复省略的代词的方法。该方法可以包括由计算机接收与一个或更多个输入字对应的数据,并确定所接收的输入字数据的上下文表示。计算机可以基于与上下文表示相关联的概率值来确认被省略的代词,并且可以确定与所接收到的输入字中的一个或更多个相关联的跨度,该跨度对应于输入字中的由省略的代词指代的输入字。

根据另一方面,提供了用于恢复省略的代词的计算机系统。计算机系统可以包括:一个或更多个处理器;一个或更多个计算机可读存储器;一个或更多个计算机可读有形存储装置;以及程序指令,所述程序指令存储在一个或更多个存储装置中的至少一个上,以用于由一个或更多个处理器中的至少一个经由一个或更多个存储器中的至少一个来执行,由此计算机系统能够执行该方法。该方法可以包括由计算机接收与一个或更多个输入字对应的数据,并确定所接收到的输入字数据的上下文表示。计算机可以基于与上下文表示相关联的概率值来确认被省略的代词,并且可以确定与一个或更多个接收到的输入字相关联的跨度,该跨度对应于输入字中的由省略的代词指代的输入字。

根据又一方面,提供了用于恢复被省略的代词的计算机可读介质。该计算机可读介质可以包括一个或更多个计算机可读存储装置和存储在一个或更多个有形存储装置中的至少一个上的程序指令,程序指令能够由处理器执行。程序指令能够由用于执行如下方法的处理器执行,该方法可以相应地包括由计算机接收与一个或更多个输入字对应的数据并确定所接收到的输入字数据的上下文表示。计算机可以基于与上下文表示相关联的概率值来确认被省略的代词,并且可以确定与所接收到的输入字中的一个或更多个相关联的跨度,该跨度对应于输入字中的由省略的代词指代的输入字。

附图说明

这些和其他目的、特征和优点将从下面结合附图阅读的说明性实施方式的详细描述中变得明显。由于图示是为了清楚地帮助本领域技术人员结合具体实施方式来理解本公开内容,附图的各种特征不是按比例的。在附图中:

图1示出了根据至少一个实施方式的联网计算机环境;

图2是根据至少一个实施方式的检测和恢复被省略的代词的程序的框图;

图3是根据至少一个实施方式的由检测和恢复被省略的代词的程序执行的步骤的操作流程图;

图4是根据至少一个实施方式的包括图1中描绘的计算机系统的说明性云计算环境的框图;

图5是根据至少一个实施方式的图4的说明性云计算环境的功能性层的框图;以及

图6是根据至少一个实施方式的图1中描绘的计算机和服务器的内部组件和外部组件的框图。

具体实施方式

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯美国有限责任公司,未经腾讯美国有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202080037806.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top