[发明专利]社交网络中基于事件关联的故事脉络生成方法有效
申请号: | 201810067320.7 | 申请日: | 2018-01-24 |
公开(公告)号: | CN108280772B | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 马帅;李莹莹;蒋浩谊;刘喆 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06F16/35 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社交 网络 基于 事件 关联 故事 脉络 生成 方法 | ||
本发明提出了一种在社交网络中基于事件关联的故事脉络生成方法。如图1所示为本发明的处理流程图,该流程主要包括三个阶段。首先进行事件检测,从微博流中检测强相关的事件;然后通过关联事件组装故事;最后生成并展示每个故事的故事脉络。
技术领域
本发明涉及一种社交网络,尤其涉及一种社交网络中基于事件关联的故事脉络生成方法。
背景技术
社交网络已经被政府、公司和等广泛的用于发布新闻和报道事件。社交网络中新闻的实时性和快速传播性使得社交网络成为一个浏览新闻的重要媒介,通过短文本传递关键信息也有助于我们理解事件。然而,微博的快速积累,以及社交网络中的短文本包含大量含口语化的表达和错别字等使得监控事件的发展过程(即故事脉络)难以完全获取,另外,阅读所有相关的独立微博也将耗费大量的时间。因此,检测事件、高效的组装故事和用合适的方式可视化故事脉络成为亟待解决的问题。
现有技术中,基于用户查询的故事脉络生成方法用与用户查询相关的文本生成故事脉络。一是提取与查询相关的新闻文本,根据基于图的词聚类方法发现事件,并根据事件间关联关系生成故事脉络。二是根据主题相关的对象构造一个带权重的图,并使用最小权重的连通支配集选择对象生成故事脉络。三是检测相关的tweets,构造带权重的图,并使用最小权重的连通支配集选择tweets生成故事脉络。
自动的故事脉络生成方法不需要用户指定与故事相关的关键词,自动的根据文本生成故事脉络。大致可分为两类:逐步方法和统一方法。逐步方法把故事脉络生成形式化为多个独立的组件:事件检测、故事组装和脉络生成。统一方法用一个模型生成故事脉络。
逐步方法把故事脉络生成形式化为多个独立的组件:事件检测、故事组装和脉络生成。现有技术进行事件检测的方法,一是把社交流建模成动态的微博网络并把网络中的一个类作为一个事件;二是对新闻文本流聚类并把一个类作一个事件。现有技术进行故事组装中,基于语义距离和给定的阈值把事件分配给已经存在的故事。现有技术进行脉络生成中,或者用事件间的Jaccard系数和给定的阈值连接事件并生成故事脉络;或者用自定义的函数,即连接强度,生成故事脉络。
现有技术中统一方法用一个模型生成故事脉络。一是假设一个新闻文章报道故事的一个进展,通过把文章连接到最相关的文章生成故事脉络。二是用无监督的隐变量模型在新闻文本流中建模故事在连续时间的发展过程。三是构造一个基于非负矩阵分解的主题模型并用该模型从微博流中追踪故事在连续时间的发展过程。
然而,现有技术基于用户查询的故事脉络生成方法强依赖于用户指定的查询,这使得该类方法的使用受到一定的局限。而自动的故事脉络生成方法逐步方法中,若两个事件间的相似度大于给定的阈值,连接两个事件,然后设定一个合理的阈值很困难,并且这种相似度计算方式不客观,难以获得真实的结果。社交网络数据较新闻文本有独特的特征,基于新闻文本的故事脉络生成方法在社交网络数据中不能得到承诺的效果。而统一方法中单个微博不包含事件的所有关键元素(例地点和参与者),因此统一方法不能直接应用到社交网络中,以及不能连接有较长时间跨度的事件。
发明内容
为解决上述问题,本发明提出了一种在社交网络中基于事件关联的故事脉络生成方法。该方法主要包括三个步骤。首先,从微博流中检测强相关的事件;然后,通过关联事件组装故事;最后,生成并展示每个故事的故事脉络。本发明的社交网络中基于事件关联的故事脉络生成方法中事件脉络更清晰,可视化效果更好,可以更优的应用到社交网络中帮助用户理解事件的发展过程。
附图说明
图1为本发明的处理流程图;
图2为本发明一实施例的处理流程步骤。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810067320.7/2.html,转载请声明来源钻瓜专利网。