[发明专利]基于对话的异常个性检测方法及装置有效
申请号: | 201810015868.7 | 申请日: | 2018-01-08 |
公开(公告)号: | CN108197274B | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 孙晓;张陈;丁帅;杨善林 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06K9/62;G06N3/08;G06N20/10 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;余罡 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 对话 异常 个性 检测 方法 装置 | ||
本发明提供了一种基于对话的异常个性检测方法及装置。该方法包括:获取社交媒体中第一预设数量条对话数据;利用支持向量机SVM对所述第一预设数量条对话数据进行情感识别,得到第二预设数量种情感下的公众情感和每个用户情感;分别标记所述第二预设数量种情感下的公众情感和每个用户情感;基于所述第二预设数量种情感下的公众情感和每个用户情感的标记确定公众和每个用户的情感转移张量;对所述第二预设数量条对话的情感转移进行概率统计,得到公众和每个用户的情感转移张量;根据公众的情感转移张量和每个用户的情感转移张量计算张量相似度;根据所述张量相似度和相似度阈值确定异常用户个体。可见,本实施例可以快速确定异常用户个体。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于对话的异常个性检测方法及装置。
背景技术
相关技术中历史对话数据主要包括以下方案:
首先通过收集历史对话数据并进行标注,利用标注好的数据对异常检测模型进行训练,在收到实时对话数据时利用训练好的异常检测模型进行异常检测并获得结果;其中对异常检测模型训练是指:通过将异常检测问题归结为二分类问题(I代表有异常,O代表没有异常),并利用机器学习模型,例如支持向量机(SVM)或者神经网络训练一个二分类器,即异常检测模型。但是上述方法忽略了每个用户的不同以及外界刺激因素的不同等因素,仅依据历史会话语料训练出模型,导致检测异常不准确。另外,检测结果仅包括异常和非异常,是一种粗略的定性描述,而非定量描述。
发明内容
本发明实施例提供了一种基于对话的异常个性检测方法及装置,以解决相关技术中的不足。
第一方面,本发明提供了一种基于对话的异常个性检测方法,所述方法包括:
获取社交媒体中第一预设数量条对话数据;
利用支持向量机SVM对所述第一预设数量条对话数据进行情感识别,得到第二预设数量种情感;
分别标记所述第二预设数量种情感下的公众情感和每个用户情感;
对所述第二预设数量条对话的情感转移进行概率统计,得到公众和每个用户的情感转移张量;
根据公众的情感转移张量和每个用户的情感转移张量计算张量相似度;
根据所述张量相似度和相似度阈值确定异常用户个体。
可选地,所述第二预设数量种情感包括中性、开心、惊讶、伤心和生气。
可选地,所述情感转移张量采用以下形式表示:
{初始情感,刺激情感,生成情感,转移概率}。
可选地,采用下式计算公众的情感转移张量和每个用户的情感转移张量的张量相似度:
式中,张量A和B分别表示公众的情感转移张量和每个用户的情感转移张量;Am::和Bn::是张量A和B的片矩阵,Sim(Am::,Bn::)是张量A和B在低维空间上的相似度。
第二方面,本发明提供了一种基于对话的异常个性检测装置,所述装置包括:
对话数据获取模块,用于获取社交媒体中第一预设数量条对话数据;
情感识别模块,用于利用支持向量机SVM对所述第一预设数量条对话数据进行情感识别,得到第二预设数量种情感;
对话数据标记模块,用于分别标记所述第二预设数量种情感下的公众情感和每个用户情感;
转移张量确定模块,用于对所述第二预设数量条对话的情感转移进行概率统计,得到每个公众和每个用户的情感转移张量;
相似度计算模块,用于根据公众的情感转移张量和每个用户的情感转移张量计算张量相似度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810015868.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多用户数据同步的方法及装置
- 下一篇:一种分布式文件列存储索引方法