[发明专利]一种知识图谱的构建方法与系统在审
| 申请号: | 202011320762.1 | 申请日: | 2020-11-23 | 
| 公开(公告)号: | CN112287125A | 公开(公告)日: | 2021-01-29 | 
| 发明(设计)人: | 熊常春;王敬贵;李海良;张林;刘昂;吴江川;高晓影 | 申请(专利权)人: | 深圳季连科技有限公司 | 
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/332;G06F40/295;G06Q30/02 | 
| 代理公司: | 广州海藻专利代理事务所(普通合伙) 44386 | 代理人: | 郑凤姣 | 
| 地址: | 518000 广东省深圳市南山区粤海街道*** | 国省代码: | 广东;44 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 知识 图谱 构建 方法 系统 | ||
本发明根据用户数据构建的知识图谱和广告用户以及相关用户的回答,识别广告用户;根据识别出的广告用户以及获取节点广告概率值较高的节点,从知识图谱中去除与之相关的三元组;根据用户的问题,通过实体识别和关系预测技术得到知识图谱对应三元组中的主语和谓语,返回用户提问问题的答案;在用户与聊天机器人聊天过程中,对聊天机器人回答内容进行的评价,识别答案中是否有广告答案,当遇到广告内容或用户差评时,确定该用户为广告敏感者;根据广告敏感者的判定,机器人回答他们的问题时,选择偏向非广告的答案。本发明知识图谱的构建对广告的注入进行有效地识别,并有针对性的清理知识图谱中含有的广告内容的三元组。
【技术领域】
本发明涉及人工智能领域,尤其涉及一种基于用户回答问题的知识图谱的构建时,有效识别攻击者及知识图谱中违规的三元组。
【背景技术】
ConceptNet知识图谱主要依靠互联网众包、专家创建和游戏三种方法来构建。其中专家构建知识图谱是基于内部人员能够控制的,但是专家数量毕竟少数,大多数的知识图谱数据依然来源于通过众包和最初来源于游戏的conceptnet,它根据在游戏中提问,而抽取出用户的答案,并构建出知识图谱,但是别有用心的人,在知识图谱构建过程中,会通过多人同时故意输入错误的广告内容,而污染系统正确性。
发明专利CN201910290476.6基于灾害场景的知识图谱构建方法,从一个或多个灾害数据源中获取灾害场景的数据信息,并对所获取的数据进行知识融合、消除数据间的矛盾和歧义,对知识融合后的数据信息进行知识推理。但该发明在构建知识图谱的时候,并没有对信息进行广告识别,不能很好的判断信息是否都为广告信息。
本发明可以有效检测出含有广告内容的三元组以及相关联的用户,针对性的对三元组和用户进行删除,避免了在用知识图谱做问答时,出现大量广告内容的情形。
【发明内容】
本发明提供了一种知识图谱的构建方法用于基于用户回答问题去除知识图谱的构建与去除知识图谱中的广告三元组,使知识图谱中的三元组更具有存在的意义。
本发明提供了一种知识图谱的构建方法,主要包括以下步骤:
根据用户问答过程构建的知识图谱和广告用户以及相关用户的回答,识别广告用户;根据识别出的广告用户,从知识图谱中去除与之相关的三元组;根据知识图谱中已有三元组中的实体,通过广告词概率分析,获取节点广告概率表,并去除广告概率值较高的节点;根据用户的问题,通过实体识别和关系预测技术得到知识图谱对应三元组中的主语和谓语,返回用户提问问题的答案;在用户与聊天机器人聊天过程中,对聊天机器人回答内容进行的评价,识别答案中是否有广告答案,当遇到广告内容或用户差评时,定义该用户为广告敏感者;根据广告敏感者的判定,机器人回答他们的问题时,答案要更加的偏向非广告;
进一步可选地,如上所述的方法中,所述根据用户游戏数据构建的知识图谱和广告用户以及相关用户的回答,识别广告用户,主要包括:
用户回答问题后,concepnet会根据问题和答案抽取出相应的三元组,即(主语,谓语,宾语)。将刚刚抽取到的三元组中的主语即用户名取出来,将它与用户表中用户名进行精确匹配,如果没有匹配成功,则将该用户判定为新用户,如果匹配成功,说明该用户之前在游戏中回答过别的问题,根据用户表,得到此用户回答过的问题总数,当问题总数小于预设阈值,例如3,判定该用户为新用户;当问题总数超过预设阈值,例如3,则判定该用户为非新用户。
对于非新用户,根据用户表中此非新用户对应的三元组id,将刚刚生成的三元组中的宾语分别与知识图谱中对应的三元组中的宾语进行相似度匹配以及将三元组中的谓语和知识图谱中对应三元组中的谓语输入到情感分析模块,确定此用户回答问题的情感方向,所述情感分析模块中包含的情感方向包括喜欢、批评两大类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳季连科技有限公司,未经深圳季连科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011320762.1/2.html,转载请声明来源钻瓜专利网。





