[发明专利]一种知识图谱的构建方法与系统在审
| 申请号: | 202011320762.1 | 申请日: | 2020-11-23 |
| 公开(公告)号: | CN112287125A | 公开(公告)日: | 2021-01-29 |
| 发明(设计)人: | 熊常春;王敬贵;李海良;张林;刘昂;吴江川;高晓影 | 申请(专利权)人: | 深圳季连科技有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/332;G06F40/295;G06Q30/02 |
| 代理公司: | 广州海藻专利代理事务所(普通合伙) 44386 | 代理人: | 郑凤姣 |
| 地址: | 518000 广东省深圳市南山区粤海街道*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 知识 图谱 构建 方法 系统 | ||
1.一种知识图谱的构建方法,其特征在于,所述方法包括:
根据用户数据构建的知识图谱和广告用户以及相关用户的回答,识别广告用户;
获取用户数据,以及利用所述用户数据构建的知识图谱,所述知识图谱包括三元组;
利用所述用户数据识别出广告用户以及所述广告用户提交的数据;
从所述知识图谱中去除与所述广告用户提交的数据相关的三元组;
在去除与所述广告用户提交的数据相关的三元组后,进一步识别知识图谱中的广告节点并去除,得到最终的知识图谱;根据识别出的广告用户以及获取节点广告概率值较高的节点,从知识图谱中去除与之相关的三元组;
将所述最终的知识图谱应用于聊天机器人,所述聊天机器人在获取用户的问题后,通过实体识别和关系预测技术得到知识图谱对应三元组中的主语和谓语,返回用户提问问题的答案;
在用户与聊天机器人聊天过程中,对聊天机器人回答内容进行的评价,识别答案中是否有广告答案,若检测到广告内容或用户差评时,确定该用户为广告敏感者;
根据广告敏感者的判定,机器人回答广告敏感者的问题时,选择偏向非广告的答案。
2.根据权利要求1所述的方法,其中,所述根据用户数据构建的知识图谱和广告用户以及相关用户的回答,识别广告用户,主要包括:
用户回答问题后,根据问题和答案抽取出相应的三元组;
将抽取到的三元组中的主语即用户名取出来,将它与用户表中用户名进行精确匹配,如果没有匹配成功,则将该用户判定为新用户,如果匹配成功,根据用户表,得到此用户回答过的问题总数,当问题总数小于等于预设阈值时,判定该用户为新用户;
当问题总数超过预设阈值时,则判定该用户为非新用户,对于非新用户,根据用户表中非新用户对应的三元组id,将生成的三元组中的宾语分别与知识图谱中对应的三元组中的宾语进行相似度匹配以及将三元组中的谓语和知识图谱中对应三元组中的谓语输入到情感分析模块,确定此用户回答问题的情感倾向,所述情感分析模块中包含的情感方向包括喜欢、批评两大类;
对于新用户以及通过之前检测的用户,通过他们使用电脑的IP地址和回答问题的时间,以回答问题时间为中间时间,分别向前、后增加预设分钟数,在1小时的范围内且在该IP地址所在的网络段中,将回答同一问题的用户挑选出来,将挑选出来的用户和当前用户的答案进行相似度匹配,判断这些用户是否为广告发布者;
如果为广告发布者,进一步判定该用户是否与其他用户形成团队作案。
3.根据权利要求2所述的方法,其中,根据用户表中非新用户对应的三元组id,将生成的三元组中的宾语分别与知识图谱中对应的三元组中的宾语进行相似度匹配,判定该用户是否为广告发布者,主要包括:
当前用户与用户表中存有的用户匹配成功且判定为非新用户时,如果此用户生成的三元组中的宾语与知识图谱中已存此用户三元组的宾语相似度达到预设的阈值,则判断该用户为广告发布者;当相似度在预设的阈值之间时,通过游戏中的系统消息给此用户发警告信息。
4.根据权利要求2所述的方法,其中,将三元组中的谓语和知识图谱中对应三元组中的谓语输入到情感分析模块,查看此用户回答问题的情感方向,判定该用户是否为广告发布者,主要包括:
情感分析模块对输入的谓语根据喜欢和批评两种情感方向进行划分,通过喜欢方向的答案除以总问题数得到喜欢方向的占比率,同理通过批评方向的答案除以总问题数得到批评方向的占比率,这两个占比率中的某一个值大于或等于预设的阈值,判定该用户为广告发布者。
5.根据权利要求2所述的方法,其中,判定该用户是否与其他用户形成团队作案,主要包括:
当情感分析模块得到的两个占比率都小于预设的阈值时或判定为新用户的用户,进行团体作案判定,当某些用户在当前用户回单问题的预设时间范围内且在该IP地址所在的网络段时,将这些用户和当前用户的答案进行相似度匹配,如果相似度大于或等于预设的阈值,则判定这些用户为广告发布者,如果相似度低于预设的阈值,则判定这些用户没有关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳季连科技有限公司,未经深圳季连科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011320762.1/1.html,转载请声明来源钻瓜专利网。





