[发明专利]消息摘要的生成方法和装置有效
申请号: | 201810552736.8 | 申请日: | 2018-05-31 |
公开(公告)号: | CN110175323B | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 李菁;宋彦;史树明 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F40/205;G06Q50/00 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 消息 摘要 生成 方法 装置 | ||
本发明的实施例提供了一种消息摘要的生成方法和装置。该生成方法包括:从待处理的消息集合中获取具有关联关系的多条消息;生成所述多条消息中每条消息对应的功能标签的分布模型、情感标签的分布模型、词类别标签的分布模型和词情感极性标签的分布模型;基于所述功能标签的分布模型、情感标签的分布模型、词类别标签的分布模型和词情感极性标签的分布模型,确定多条消息包含的词类别为主题内容词的分布概率;根据所述主题内容词的分布概率,生成所述多条消息的摘要。本发明实施例的技术方案能够保证得到更加准确的消息摘要,确保消息摘要中能够包含更多的重要内容,提高了确定的消息摘要的质量。
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种消息摘要的生成方法和装置。
背景技术
目前,在提取社交媒体中的消息摘要时,通常是将每条消息作为一篇文章(例如:微信朋友圈中的每一条状态被看成一篇文章),然后利用基于内容的多文章摘要方法来抽取消息的摘要。而社交媒体中的消息由于文本短、噪音大、语言非正式等特点导致直接利用基于内容的多文章摘要方法无法获得理想的效果。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明实施例的目的在于提供一种消息摘要的生成方法和装置,进而至少在一定程度上克服现有技术中无法准确得到消息摘要的问题。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明实施例的一个方面,提供了一种消息摘要的生成方法,包括:从待处理的消息集合中获取具有关联关系的多条消息;生成所述多条消息中每条消息对应的功能标签的分布模型、情感标签的分布模型、词类别标签的分布模型和词情感极性标签的分布模型,所述词类别标签的分布模型表示具有不同功能标签的消息包含各种类别的词的概率,所述词情感极性标签的分布模型表示具有不同情感标签的消息包含各种情感极性的词的概率;基于所述功能标签的分布模型、所述情感标签的分布模型、所述词类别标签的分布模型和所述词情感极性标签的分布模型,确定所述多条消息包含的词类别为主题内容词的分布概率;根据所述主题内容词的分布概率,生成所述多条消息的摘要。
在本发明的一些实施例中,基于前述方案,根据所述主题内容词的分布概率,生成所述多条消息的摘要,包括:基于所述主题内容词的分布概率,选择预定数量的主题内容词生成所述多条消息的摘要。
在本发明的一些实施例中,基于前述方案,从待处理的消息集合中获取具有关联关系的多条消息,包括:根据消息之间的回复和/或转发关系,从所述消息集合中获取具有所述回复和/或转发关系的多条消息。
在本发明的一些实施例中,基于前述方案,所述的消息摘要的生成方法还包括:基于所述多条消息之间的回复和/或转发关系,生成所述多条消息对应的消息树。
根据本发明实施例的一个方面,提供了一种消息摘要的生成装置,包括:获取单元,用于从待处理的消息集合中获取具有关联关系的多条消息;模型生成单元,用于生成所述多条消息中每条消息对应的功能标签的分布模型、情感标签的分布模型、词类别标签的分布模型和词情感极性标签的分布模型,所述词类别标签的分布模型表示具有不同功能标签的消息包含各种类别的词的概率,所述词情感极性标签的分布模型表示具有不同情感标签的消息包含各种情感极性的词的概率;处理单元,用于基于所述功能标签的分布模型、所述情感标签的分布模型、所述词类别标签的分布模型和所述词情感极性标签的分布模型,确定所述多条消息包含的词类别为主题内容词的分布概率;生成单元,用于根据所述主题内容词的分布概率,生成所述多条消息的摘要。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810552736.8/2.html,转载请声明来源钻瓜专利网。