[发明专利]声誉管理框架内的新闻议题分析方法和实施系统有效
申请号: | 201711043090.2 | 申请日: | 2017-10-31 |
公开(公告)号: | CN107918644B | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 李言生 | 申请(专利权)人: | 北京锐思爱特咨询股份有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/36 |
代理公司: | 北京华睿卓成知识产权代理事务所(普通合伙) 11436 | 代理人: | 刘海 |
地址: | 100027 北京市朝阳区东*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声誉 管理 框架 新闻 议题 分析 方法 实施 系统 | ||
1.一种新闻议题分析方法,所述方法包括以下步骤:
信息采集和去噪步骤S1,实时获取网络中发布的新闻信息,经去噪从中获取有效信息内容,并存储到第一数据库中;
信息预处理步骤S2,包括S2-1文本分词处理,S2-2新闻要素抽取,得到所述新闻信息中包括的新闻要素,S2-3新闻合并与转载分析,将具有相似、相同新闻要素的新闻文本进行合并归类,和S2-4实体链接,建立新闻实体与知识库实体的对应链接关系,将存储在第一数据库中的所述有效信息内容经过信息预处理以后的结果存储在第二数据库中;
信息深度处理步骤S3,其中包括议题/事件聚类关联分析,采用内容-实体关联议题模型对步骤S2得到的信息预处理结果进行处理得到议题/事件聚类关联分析结果,其中,所述内容-实体关联议题模型采用两个级联的生成过程分别对内容议题和实体议题进行建模,其中所述内容议题是主要议题并可以和多个实体议题关联,生成命名实体时,首先需要选择一个内容议题作为超议题,然后生成与之相关的实体议题,最后基于多项分布生成具体的命名实体;
利益相关方关系图谱构建及展示步骤S4,根据输入关键词,结合所述信息深度处理步骤S3生成的议题/事件聚类关联分析结果,筛选与所述关键词相关的议题,构建并展示利益相关方关系图谱。
2.根据权利要求1所述的新闻议题分析方法,其中,所述信息采集和去噪步骤S1中获取的有效信息内容包括标题信息、正文内容信息和辅助信息。
3.根据权利要求1所述的新闻议题分析方法,其中,所述S2-4实体链接包括S2-4-1实体候选集合生成,S2-4-2实体候选排序,和S2-4-3无链接文本预测。
4.根据权利要求1所述的新闻议题分析方法,其中,实体间关系亲疏的度量主要依赖于议题分析得到的议题-实体分布,具体定义为与目标实体相关的议题分布间的余弦相似度,即
其中cos(.,.)用于计算两个向量的余弦相似度,K为议题数目,p(z|ei)表示实体ei的议题分布,p(z|ej)表示实体ej的议题分布,其中实体ei在具体议题zk上的概率p(zk|ei)需要通过贝叶斯公式计算,即
其中p(zk)和p(ei)分别表示议题zk和实体ei的边缘概率,ze为实体议题,p(ei|ze)和p(ze|zk)分别表示实体议题ze下实体ei和内容议题zk下实体议题ze的生成概率。
5.一种用于如权利要求1-4中任一项所述的新闻议题分析方法的新闻议题分析系统,所述系统包括以下模块:
信息采集和去噪模块M1,用于实时获取网络中发布的新闻信息,经去噪从中获取有效信息内容,并存储到第一数据库中;
信息预处理模块M2,用于对采集到的新闻信息进行预处理,并将结果存储在第二数据库中;
信息深度处理模块M3,用于进行议题/事件聚类关联分析;
利益相关方关系图谱构建及展示模块M4,用于根据输入关键词,结合所述信息深度处理模块M3生成的议题/事件聚类关联分析结果,筛选与所述关键词相关的议题,构建并展示利益相关方关系图谱。
6.如权利要求5所述的新闻议题分析系统,其中,所述文本信息预处理模块M2包括文本分词处理单元M2-1;新闻要素抽取单元M2-2,用于得到新闻要素;新闻合并与转载分析单元M2-3,用于将具有相似、相同新闻要素的新闻文本进行合并归类;和实体链接单元M2-4,用于建立新闻实体与知识库实体的对应链接关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京锐思爱特咨询股份有限公司,未经北京锐思爱特咨询股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711043090.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可调节固定的水果去核装置
- 下一篇:一种水蜜桃的自动去核装置