[发明专利]微博敏感话题的检测方法、装置及可读存储介质在审
| 申请号: | 201810965144.9 | 申请日: | 2018-08-23 |
| 公开(公告)号: | CN110858217A | 公开(公告)日: | 2020-03-03 |
| 发明(设计)人: | 于琳琳;张丹;于晓明 | 申请(专利权)人: | 北大方正集团有限公司;北京北大方正电子有限公司 |
| 主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/332;G06F16/35;G06K9/62 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张子青;刘芳 |
| 地址: | 100871 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提供的微博敏感话题的检测方法、装置及可读存储介质,通过对采集获得的微博信息进行预处理,获得待分析的微博信息的句子特征空间,所述句子特征空间包括组成所述待分析的微博信息的分词和相应的分词权重;利用预设的词语向量特征库构建所述微博信息的每一分词对应的语义特征向量,并根据所述每一分词对应的语义特征向量和分词权重构建微博信息的句子特征向量;利用预设的聚类算法,对所述微博信息对应的各句子特征向量进行聚类,以获得聚类话题;根据敏感信息特征库,在各聚类话题中确定敏感话题。从而针对于微博文本词语稀疏、语义离散、用词随意的特点,有效提高了对其语义的识别准确度,进而提高了对微博敏感话题检测的准确度。 | ||
| 搜索关键词: | 敏感 话题 检测 方法 装置 可读 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京北大方正电子有限公司,未经北大方正集团有限公司;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810965144.9/,转载请声明来源钻瓜专利网。





