[发明专利]社交网络中基于事件关联的故事脉络生成方法有效
| 申请号: | 201810067320.7 | 申请日: | 2018-01-24 |
| 公开(公告)号: | CN108280772B | 公开(公告)日: | 2022-02-18 |
| 发明(设计)人: | 马帅;李莹莹;蒋浩谊;刘喆 | 申请(专利权)人: | 北京航空航天大学 |
| 主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06F16/35 |
| 代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
| 地址: | 100191*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 社交 网络 基于 事件 关联 故事 脉络 生成 方法 | ||
1.一种在社交网络中基于事件关联的故事脉络生成方法,包括三个步骤,步骤1,从微博流中检测强相关的事件;步骤2,然后通过关联事件组装故事;步骤3,生成并展示每个故事的故事脉络;
在步骤1中,事件检测由关键词发现,关键词社区抽取,事件特征识别三个步骤组成;在步骤2中,包括故事组装和故事特征识别步骤,根据主题对事件分组,并把事件组装成故事,首先,基于事件的隐式语义特征聚类,并把一个类作为一个故事;然后,根据故事中的事件集合标识其它的故事特征,所述标识其它的故事特征包括时间、地点、参与者和关键词;在步骤3中,包括故事骨架构造和故事摘要提取步骤,为每个故事生成故事脉络,用事件有向无环图和故事摘要可视化故事脉络,用弱联通分量和最大生成树构造一个有向无环图,然后提取故事的摘要。
2.如权利要求1所述的方法,其特征在于,在步骤1中,在所述关键词发现步骤中,采用异常词检测方法检测包含不寻常模式的关键词并获得关键词图;在关键词社区抽取步骤中,采用重叠的社区检测算法过滤关键词社区并把一个社区作为一个事件的关键词集合;在事件特征识别步骤中,根据事件的关键词识别事件的其它特征,所述识别事件的其它特征包括时间、地点、参与者、描述和微博集合,所述时间表示该事件被检测的时间,微博集合中的微博包含事件的所有关键词,所述地点为命名实体中最频繁出现的地点,所述参与者为命名实体中所有人物和组织。
3.如权利要求1所述的方法,其特征在于,在步骤2的故事构造步骤中,LDA捕捉事件的隐式语义特征,观察发现相同主题下的事件倾向于有更多的共有的词,首先进行预聚类,然后根据预聚类结果初始化LDA并进行精细聚类,在所述精细聚类中,根据预聚类结果初始化LDA,相同预聚类中的事件中的词被分配到相同的主题中,然后对LDA进行抽样,并根据事件的主题向量把事件分配到故事中;在所述故事特征识别步骤中,根据该故事的事件集合识别故事特征,首先将故事的开始时间和结束时间分别被赋值为事件集合中的最早时间和最晚时间,然后将地点、参与者和关键词集合作为相应的事件特征的并集。
4.如权利要求1所述的方法,其特征在于,在步骤3的故事骨架构造中,将故事骨架表示为一个事件有向无环图,首先计算任意两事件间的有向边并生成一个事件图,然后构造事件图的弱联通分量集合;最后为每个弱联通分量构造最大生成树;然后进行故事摘要提取,从故事内事件的描述中提取一些句子用于表示故事摘要; 首先为每个最大生成树生成摘要,然后将所述摘要合并起来表示故事摘要。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810067320.7/1.html,转载请声明来源钻瓜专利网。





