[发明专利]人事关系图谱构建方法、装置以及计算机存储介质在审
申请号: | 201811643559.0 | 申请日: | 2018-12-29 |
公开(公告)号: | CN109754224A | 公开(公告)日: | 2019-05-14 |
发明(设计)人: | 周星;梁志明;单若诚;张吉亮 | 申请(专利权)人: | 贵州小爱机器人科技有限公司 |
主分类号: | G06Q10/10 | 分类号: | G06Q10/10;G06F16/36;G06F16/951 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李笑笑;吴敏 |
地址: | 550017 贵州省贵阳市白*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本数据 事件实体 匹配 计算机存储介质 时间实体 图谱构建 图谱 构建 | ||
1.一种人事关系图谱构建方法,其特征在于,包括:
获取文本数据,从所述文本数据中提取专有名词和主体名称;
根据所述专有名词在所述文本数据中的位置,将所述专有名词与所述文本数据中的动词相匹配得到事件实体;
在所述文本数据中,确定与所述事件实体相匹配的时间实体以及所述主体名称;
根据所述事件实体以及与所述事件实体匹配的时间实体以及所述主体名称,构建人事关系图谱。
2.根据权利要求1所述的人事关系图谱构建方法,其特征在于,所述从所述文本数据中提取专有名词和主体名称,包括:
将所述文本数据转换为html文件格式;
通过爬虫方式,提取所述html文件格式的文本数据中的内容;
通过词义分析算法或词语数据库,提取所述文本数据的内容中的专有名词以及主体名称,所述主体名称包括人名和部门名称。
3.根据权利要求1所述的人事关系图谱构建方法,其特征在于,所述根据所述专有名词在所述文本数据中的位置,将所述专有名词与所述文本数据中的动词相匹配得到事件实体,包括:
确定所述专有名词在所述文本数据中的位置;
若在距离所述专有名词的预设词数范围内存在动词,则将所述专有名词与所述动词匹配得到事件实体。
4.根据权利要求1所述的人事关系图谱构建方法,其特征在于,所述在所述文本数据中,确定与所述事件实体相匹配的时间实体以及所述主体名称,包括:
在所述事件实体所在的语句中,通过正则表达式确定时间实体;
将所述时间实体与所述事件实体进行匹配。
5.根据权利要求4所述的人事关系图谱构建方法,其特征在于,所述将所述时间实体与所述事件实体进行匹配,包括:
当通过所述正则表达式确定多个时间实体时,根据各个时间实体在时间顺序上的关系,将最新的时间实体与所述事件实体进行匹配。
6.根据权利要求1所述的人事关系图谱构建方法,其特征在于,所述在所述文本数据中,确定与所述事件实体相匹配的的时间实体以及所述主体名称,包括:
在所述事件实体所在的语句中,确定所述主体名称;
将与所述事件实体间隔字数最少的所述主体名称,作为与所述事件实体匹配的主体名称。
7.根据权利要求1所述的人事关系图谱构建方法,其特征在于,所述根据所述事件实体以及与所述事件实体匹配的时间实体以及所述主体名称,构建人事关系图谱,包括:
将所述事件实体、与所述事件实体匹配的时间实体以及主体名称作为关系数据;
使用多条所述关系数据构建人事关系图谱。
8.一种人事关系图谱构建装置,其特征在于,包括:获取单元,第一匹配单元,第二匹配单元与构建单元,其中:
所述获取单元,用于获取文本数据,从所述文本数据中提取专有名词和主体名称;
所述第一匹配单元,用于根据所述专有名词在所述文本数据中的位置,将所述专有名词与所述文本数据中的动词相匹配得到事件实体;
所述第二匹配单元,用于在所述文本数据中,确定与所述事件实体相匹配的时间实体以及所述主体名称;
所述构建单元,用于根据所述事件实体以及与所述事件实体匹配的时间实体以及所述主体名称,构建人事关系图谱。
9.一种计算机可读存储介质,其上存储有计算机指令,所述计算机可读存储介质为非易失性存储介质或非瞬态存储介质,其特征在于,所述计算机指令运行时执行权利要求1~7任一项所述的人事关系图谱构建方法的步骤。
10.一种电子设备,包括存储器和处理器,所述存储器上存储有计算机指令,其特征在于,所述计算机指令运行时所述处理器执行权利要求1~7任一项所述的人事关系图谱构建方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州小爱机器人科技有限公司,未经贵州小爱机器人科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811643559.0/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理