[发明专利]应用于文本细粒度实体分类的特征表示方法及相关设备在审

专利信息
申请号: 202211070958.9 申请日: 2022-09-02
公开(公告)号: CN115422913A 公开(公告)日: 2022-12-02
发明(设计)人: 郭延明;刘盼;雷军;老松杨;李国辉;尹晓晴 申请(专利权)人: 中国人民解放军国防科技大学
主分类号: G06F40/211 分类号: G06F40/211;G06F40/279;G06F40/30;G06F16/33;G06N3/04;G06N3/08
代理公司: 北京风雅颂专利代理有限公司 11403 代理人: 曾志鹏
地址: 410003 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 应用于 文本 细粒度 实体 分类 特征 表示 方法 相关 设备
【说明书】:

本申请提供一种应用于文本细粒度实体分类的特征表示方法及相关设备。能够确定目标文本的字符中的实体提及,将实体提及放回至上下文字符中,进而得到上下文字符表示,并利用上下文表征模型对其进行张量确定处理,得到上下文张量信息,再通过注意力机制对上下文张量信息进行计算处理,这样得到的上下文特征能够具备上下文的特点,能够在上下文特征中将实体提及与上下文的联系一起包含在内,使得后续进行细粒度实体分类时,得到的分类结果更加精确,进一步提高细粒度实体分类的效果。

技术领域

本申请涉及语义处理技术领域,尤其涉及一种应用于文本细粒度实体分类的特征表示方法及相关设备。

背景技术

细粒度实体分类任务赋予文本中的实体以细粒度类别,能够通过类别信息为实体提供丰富的语义信息,在关系抽取、实体链接、问答系统等下游任务中发挥重要作用。

由于实体在句子中的长度和位置是不统一的,无法直接计算实体在上下文中的表示,现有的细粒度实体分类模型将实体提及与其上下文分别进行处理和特征表示,割裂了实体与其上下文之间的语义关联。

发明内容

有鉴于此,本申请的目的在于提出一种应用于文本细粒度实体分类的特征表示方法及相关设备,应以解决或部分解决上述技术问题。

基于上述目的,本申请的第一方面提供了一种应用于文本细粒度实体分类的特征表示方法,包括:

对目标文本进行字符表示;

确定所述字符中的实体提及以及所述实体提及对应的上下文字符,将所述实体提及放回至所述上下文字符中得到上下文字符表示;

将所述上下文字符表示输入至上下文表征模型中,进行张量确定处理,得到上下文张量信息,对所述上下文张量信息进行计算处理得到所述目标文本的上下文特征,其中,所述上下文表征模型是利用训练样本对神经网络进行训练得到的。

基于同一个发明构思,本申请的第二方面提出了一种应用于文本细粒度实体分类的特征表示装置,包括:

字符表示模块,被配置为对目标文本进行字符表示;

上下文表示模块,被配置为确定所述字符中的实体提及以及所述实体提及对应的上下文字符,将所述实体提及放回至所述上下文字符中得到上下文字符表示;

模型处理模块,被配置为将所述上下文字符表示输入至上下文表征模型中,进行张量确定处理,得到上下文张量信息,对所述上下文张量信息进行计算处理得到所述目标文本的上下文特征,其中,所述上下文表征模型是利用训练样本对神经网络进行训练得到的。

基于同一个发明构思,本申请的第三方面提出了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述的方法。

从上面所述可以看出,本申请提供的应用于文本细粒度实体分类的特征表示方法及相关设备,能够确定目标文本的字符中的实体提及,将实体提及放回至上下文字符中,进而得到上下文字符表示,并利用上下文表征模型对其进行张量确定处理,得到上下文张量信息,再通过注意力机制对上下文张量信息进行计算处理,这样得到的上下文特征能够具备上下文的特点,能够在上下文特征中将实体提及与上下文的联系一起包含在内,使得后续进行细粒度实体分类时,得到的分类结果更加精确,进一步提高细粒度实体分类的效果。

附图说明

为了更清楚地说明本申请或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为传统的细粒度实体分类模型的处理示意图;

图2A为本申请实施例的应用于文本细粒度实体分类的特征表示方法的流程图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211070958.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top