[发明专利]数据处理方法、装置及存储介质有效
申请号: | 202110397661.2 | 申请日: | 2021-04-14 |
公开(公告)号: | CN113254635B | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 李晨曦;荆宁 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/216;G06F40/126 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;杜维 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 存储 介质 | ||
本申请实施例提出了一种数据处理方法、装置及存储介质,涉及计算机技术领域,该方法包括:获取待处理文本中的目标实体,所述目标实体为所述待处理文本中任一实体;调用第一分类网络对所述目标实体的第一类别信息和实体类型先验数据进行处理,以得到所述目标实体的第二类别信息,所述第一类别信息是通过调用第二分类网络对所述待处理文本和所述目标实体进行处理得到的;基于所述第二类别信息确定所述目标实体的分类结果,所述分类结果包括至少一个实体类型,可以利用实体类型先验数据,有效地提升对实体进行细粒度分类的准确度。
技术领域
本申请涉及计算机技术领域,尤其涉及一种数据处理方法、装置及存储介质。
背景技术
自然语言中的实体是指语句中出现的客观世界中存在的,并可相互区别的对象或概念。实体的实体类型识别就是给定一个实体及其所在的上下文,确定实体在该上下文中的类型,比如“苹果”作为一个实体可以是“水果”、“手机”、“公司”。实体类型识别是自然语言处理(Natural Language Processing,NLP)领域中一些复杂任务的基础,例如语义分析、问答系统、机器翻译、知识图谱构建等,因此一直以来都是NLP领域中的研究热点。
目前通常是基于实体和实体的上下文文本来确定实体的分类结果,一般准确度不高,特别是由于短文本存在文本信息不足、噪音等问题,导致准确度会更低。
发明内容
本申请实施例提供了一种数据处理方法、装置及存储介质,可以利用实体类型先验数据,有效地提升对实体进行细粒度分类的准确度。
一方面,本申请实施例提供了一种数据处理方法,所述方法包括:
获取待处理文本中的目标实体,所述目标实体为所述待处理文本中任一实体;
调用第一分类网络对所述目标实体的第一类别信息和实体类型先验数据进行处理,以得到所述目标实体的第二类别信息,所述第一类别信息是通过调用第二分类网络对所述待处理文本和所述目标实体进行处理得到的;
基于所述第二类别信息确定所述目标实体的分类结果,所述分类结果包括至少一个实体类型。
另一方面,本申请实施例提供了一种数据处理装置,所述装置包括:
获取模块,用于获取待处理文本中的目标实体,所述目标实体为所述待处理文本中任一实体;
处理模块,用于调用第一分类网络对所述目标实体的第一类别信息和实体类型先验数据进行处理,以得到所述目标实体的第二类别信息,所述第一类别信息是通过调用第二分类网络对所述待处理文本和所述目标实体进行处理得到的;
所述处理模块,还用于基于所述第二类别信息确定所述目标实体的分类结果,所述分类结果包括至少一个实体类型。
相应地,本申请实施例提供了一种计算机设备,该设备包括处理器、通信接口和存储器,所述处理器、所述通信接口和所述存储器相互连接,其中,所述存储器存储有可执行程序代码,所述处理器用于调用所述可执行程序代码,执行上述任一可能实现方式所述的数据处理方法。
相应地,本申请实施例提供了一种计算机可读存储介质,存储有计算机程序,所述处理器执行上述任一可能实现方式所述的数据处理方法所涉及的程序。
相应地,本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任一可能实现方式所述的数据处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110397661.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种便携的防潮档案盒
- 下一篇:LDMOS器件和形成LDMOS器件的方法