[发明专利]事件抽取服务的生成方法、装置、服务器以及介质有效
| 申请号: | 202011463891.6 | 申请日: | 2020-12-11 |
| 公开(公告)号: | CN112560462B | 公开(公告)日: | 2023-08-01 |
| 发明(设计)人: | 李心雨;李法远;陈玉光;汪思麒 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F40/279 | 分类号: | G06F40/279 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 王萌 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 事件 抽取 服务 生成 方法 装置 服务器 以及 介质 | ||
本申请公开了一种事件抽取服务的生成方法、装置、服务器及介质,涉及自然语言处理、云计算、深度学习和知识图谱领域,具体实现过程为:接收发送的标注请求,根据标注请求中的事件标注内容,对训练样本进行标注;采用经过标注的训练样本,对事件抽取模型进行训练,并分配用于调用事件抽取模型的事件抽取服务端口;向客户端发送事件抽取服务端口。由此,在接收到客户端发送的标注请求后,根据标注请求中的事件标注内容对训练样本进行标注,使得用户在客户端根据个性化需求对训练样本进行标注,以得到个性化的事件抽取服务。
技术领域
本申请公开了一种事件抽取服务的生成方法、装置、服务器以及存储介质,涉及深度学习技术领域,具体涉及自然语言处理、云计算和知识图谱技术领域。
背景技术
近些年来,随着各领域数字化的兴起,各行业都将大量的文件存储在网络上。这些海量的数据大多是结构化或者半结构化的数据,用户很难从中获取要需要的信息,因此需要从海量的数据中抽取出结构化的信息。
事件抽取是指识别特定类型的事件,并进行相关信息确定和抽取。不同行业的不同从业者对于抽取事件类型及属性的需求并不相同,所需抽取的文本或者资讯信息类型也不尽相同,通用的抽取服务并不能满足各行业的事件抽取需求。因此,急需一套可定制化的事件抽取服务,以满足不同行业对事件抽取的需求。
发明内容
本申请提供了一种事件抽取服务的生成方法、装置、服务器以及存储介质。
根据本申请的一方面,提供了一种事件抽取服务的生成方法,包括:
接收客户端发送的标注请求;
根据所述标注请求中的事件标注内容,对训练样本进行标注;
采用经过标注的所述训练样本,对事件抽取模型进行训练,并分配用于调用所述事件抽取模型的事件抽取服务端口;
向所述客户端发送所述事件抽取服务端口。
作为本申请一方面的一种可能的实现方式,所述接收客户端发送的标注请求之前,还包括:
接收所述客户端发送的配置请求;根据所述配置请求指示的多个事件标注内容,配置各所述事件标注内容对应的标注控件;
向所述客户端发送各所述标注控件,以使所述客户端在样本标注页面对各所述标注控件进行展示,响应于对各所述标注控件的控件触发操作生成对应的所述标注请求。
作为本申请一方面的另一种可能的实现方式,所述多个事件标注内容包括至少一个事件类型和各所述事件类型包含的至少一个事件属性;
所述根据所述配置请求指示的多个事件标注内容,配置各所述事件标注内容对应的标注控件,包括:
根据所述至少一个事件类型,配置对应的各第一标注控件;
根据各所述事件类型包含的至少一个事件属性,配置各所述第一标注控件关联的第二标注控件。
作为本申请一方面的另一种可能的实现方式,所述标注请求,用于指示控件触发操作所触发的第一标注控件和第二标注控件,以及标注的训练样本;
所述根据所述标注请求中的事件标注内容,对训练样本进行标注,包括:
校验所述标注请求指示的第一标注控件,与所述标注请求指示的第二标注控件之间的关联关系;
在校验确定存在所述关联关系的情况下,采用所述标注请求指示的第一标注控件对应的事件类型,以及采用所述标注请求指示的第二标注控件对应的事件属性,标注所述标注请求指示的训练样本。
作为本申请一方面的另一种可能的实现方式,方法,还包括:
向所述客户端发送数据集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011463891.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多功能使用的节能收音机
- 下一篇:一种室内装修用墙角吊顶结构





