[发明专利]一种基于话单的用户关系确定方法和装置在审
申请号: | 201611257414.8 | 申请日: | 2016-12-30 |
公开(公告)号: | CN108268477A | 公开(公告)日: | 2018-07-10 |
发明(设计)人: | 蒋敏;郑成林;宋文山 | 申请(专利权)人: | 中国电信股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 方亮 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户关系 方法和装置 话单数据 用户交互信息 时段信息 预分类 预处理 用户间关系 个体用户 数据基础 通话记录 通信领域 信息标识 业务设置 资费标准 资费套餐 单数据 新用户 运营商 采集 挖掘 分类 对话 | ||
本发明公开了一种基于话单的用户关系确定方法和装置,涉及通信领域,其中的方法包括:采集话单数据并对话单数据进行预处理;获取话单数据的时段信息,基于时段信息对用户关系进行预分类;获取话单数据的用户交互信息,并基于用户交互信息计算用户之间的关系亲密度值,基于关系亲密度值确定被预分类的用户关系的亲密度。本发明的方法和装置,通过用户间的通话记录信息标识用户关系的分类以及关系亲密度,实现针对个体用户的社会关系的识别,从而可以使运营商在用户资费套餐的设置、新用户的挖掘推广、基本资费标准内容等方面以用户间关系的作为数据基础,提高业务设置的准确性和合理性。
技术领域
本发明涉及通信技术领域,尤其涉及一种基于话单的用户关系确定方法和装置。
背景技术
电信作为一种通信技术在不断地改变着人们的生活方式,同时也累积了大量的数据。目前,硬件设备升级已经越来越无法适应现代电信行业竞争的需求,所以众多电信企业将竞争领域转移到多年累积的用户和通话数据上。如何从现有的通话记录中挖掘出未知的规律和商业信息,已经成为了一个热门的课题。
对于数据挖掘已经提出了很多新的理论和方法,比如,Kernighan-Lin算法、谱平分法、GN算法、Moustaki算法等。一些算法在实际网络中也表现出了不错的挖掘效果。如Moustaki算法基于广义潜在特质模型提出了隐变量回归模型问题。利用大规模手机通信数据,从移动社会网络拓扑结构的角度分析用户间的关系强度,使用计算模型通过收集用户一定时间周期内的手机通话记录来计算和分析用户间的关系强度。分析了两百万用户的手机通信数据,提出衡量关系稳定性的方法,并揭示了用户关系稳定性随时间的动态变化规律。但是,目前的方法通常只给出目标用户对的总体关系强度,不能明确用户的不同关系亲密性,无法满足实际应用的需求。
发明内容
有鉴于此,本发明要解决的一个技术问题是提供一种基于话单的用户关系确定方法和装置。
根据本发明的一个实施例,提供一种基于话单的用户关系确定方法,包括:采集话单数据并对所述话单数据进行预处理;获取所述话单数据的时段信息,基于所述时段信息对用户关系进行预分类;获取所述话单数据的用户交互信息,并基于所述用户交互信息计算用户之间的关系亲密度值,基于关系亲密度值确定被预分类的用户关系的亲密度;基于预设的检验规则判断对于所述用户关系的预分类结果是否正确,如果否,则将所述用户关系标识为不能识别的用户关系。
可选地,所述对所述话单数据进行格式化处理包括:基于统计规则对第一用户与其它用户之间的第一话单进行统计,其中,所述统计规则包括按照主动性标识、交互频繁性标识、时段交互性标识和交互时长性标识进行统计。
可选地,获取对于单向的第一话单按照所述交互频次标识、所述交互方向性标识进行统计的统计结果;基于所述统计结果判断第一用户与所述单向的第一话单的主叫或被叫用户之间的关系是否为咨询关系或营销关系;如果是,则标识所述单向的第一话单为非统计数据,并从所述第一话单中删除。
可选地,所述获取所述话单数据的时段信息、基于所述时段信息对用户关系进行预分类包括:预设工作时段和休息时段的时段信息;获取对于第一话单按照所述时段标识分拣进行统计的统计结果;基于所述统计结果以及所述时段信息对第一用户与第二用户之间的关系进行预分类并标识;所述第二用户为所述第一话单的主叫或被叫用户;其中,基于工作时段进行预分类的用户关系包括:同事、业务、其它关系;基于休息时段进行预分类的用户关系包括:亲人、朋友、其它关系。
可选地,所述获取所述话单数据的用户交互信息、并基于所述用户交互信息计算用户之间的关系亲密度值包括:对于第一话单按照所述时段标识进行分拣、统计,将所述第一话单分为工作时段第一话单、休息时段第一话单;基于按照主动性标识、交互频繁性标识、交互时长性标识对所述工作时段第一话单、所述休息时段第一话单的统计结果分别确定所述第一用户与所述第二用户在工作时段、休息时段的交互强度和亲密度评估值;分别确定所述第一用户与所述第二用户在工作时段、休息时段的关系亲密度=交互强度/亲密度评估值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611257414.8/2.html,转载请声明来源钻瓜专利网。