[发明专利]消息切分方法以及装置有效
申请号: | 201810734388.6 | 申请日: | 2018-07-06 |
公开(公告)号: | CN110691025B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 李兆伟;孔智慧 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | H04L51/04 | 分类号: | H04L51/04;H04L67/565;H04L67/568;G06F9/54 |
代理公司: | 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 | 代理人: | 冯德魁;窦晓慧 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 消息 切分 方法 以及 装置 | ||
本申请公开了一种消息切分方法,包括:获取待切分的消息序列,所述消息序列包括多条消息,每一条消息具有对应的消息发送时刻,所述消息序列中的多条消息按照所述发送时刻排序;根据发送时刻来确定消息序列中各条消息之间的关联性;根据所述关联性来从所述消息序列中切分出一个或多个消息片段,每个消息片段包括具有关联性的一条或多条消息。所述消息切分方法在时间维度对消息序列中的消息进行切分,使切分后获得的消息片段在时间维度具有交互话题层面的完整性。
技术领域
本申请涉及数据处理技术领域,具体涉及一种消息切分方法。本申请同时涉及一种消息切分装置,以及一种电子设备。
背景技术
随着云计算的快速发展,使用云计算业务的客户越来越多,客户在使用云计算产品的过程中需要及时咨询和解决遇到的技术问题,为了提高服务的及时性与服务的体验,即时通信的服务渠道变的越来越重要。当客户的云计算业务受影响或者遇到紧急的技术问题,常规的服务渠道无法及时的响应,客户需要立刻到提供服务的即时通信群联系值班的服务人员,以便第一时间解决问题。对于依赖提供技术服务而生存的公司,即时通信服务群是他们需要重点关注的服务渠道,例如服务钉钉群、服务旺旺群、服务微信群、服务QQ群等,分析和挖掘这些即时通信群服务数据的价值越来越大,例如客户在群里面都问了什么问题?怎么能够有效的提取出一个一个有效的话题?怎么从这些服务数据中挖掘出潜在的价值?只能对即时通信服务群的数据进行智能切分,然后才能进行多维度、有效的分析。
目前,现有的对即时通信服务群数据进行切分和分析的方案,一种是按照固定起始时间进行暴力切分,仅按照固定的开始时间和结束时间进行切分,例如按照每天将即时通信服务群数据归档起来并进行分析。另一种是按照固定数据数目进行的暴力切分,仅按照固定的群数据条数进行切分,例如按照每20条或者100条对即时通信服务群数据进行切分归档存储。然而,现有技术提供的两种即时通信服务群数据切分方案,都没有考虑即时通信服务群数据上下文和不同话题的相关性,对即时通信服务群数据的切分比较粗糙,智能化程度也比较低。
发明内容
本申请提供一种消息切分方法,以解决现有技术存在的缺陷。本申请同时涉及一种消息切分装置,以及一种电子设备。
本申请提供一种消息切分方法,包括:
获取待切分的消息序列,消息序列包括多条消息,每一条消息具有对应的消息发送时刻,消息序列中的多条消息按照发送时刻排序;
根据发送时刻来确定消息序列中各条消息之间的关联性;
根据关联性来从消息序列中切分出一个或多个消息片段,每个消息片段包括具有关联性的一条或多条消息。
具体实施时,关联性包括时间关联性,根据发送时刻来确定消息序列中各条消息之间的关联性的步骤,包括:根据发送时刻来确定消息序列中每一对相邻消息之间的时间关联性;相应的,根据关联性来从消息序列中切分出一个或多个消息片段的步骤,包括:将消息序列中连续具有时间关联性的消息作为一个消息片段。
具体实施时,相邻消息之间的时间关联性的判断方法包括:判断相邻消息之间的发送时刻之差的绝对值是否小于或者等于时间阈值,若是,则判定相邻消息之间具有时间关联性。
具体实施时,消息序列中每一条消息具有对话角色的属性,对话角色包括:发起方和应答方;在根据关联性来从消息序列中切分出一个或多个消息片段的步骤之后,还包括:若一个消息片段仅包含一条消息,且该消息的对话角色为发起方,则丢弃该消息片段。
具体实施时,消息序列中的至少一条消息具有内容标签,内容标签包括:话题开始标签和话题结束标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810734388.6/2.html,转载请声明来源钻瓜专利网。