[发明专利]一种基于信息监测的关键词发现方法、系统和电子设备在审
申请号: | 202010944647.5 | 申请日: | 2020-09-10 |
公开(公告)号: | CN112131462A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 李洪海;邓雯;陈金朋;肖鸿武;梁朝策 | 申请(专利权)人: | 中数通信息有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/955 |
代理公司: | 北京知汇林知识产权代理事务所(普通合伙) 11794 | 代理人: | 董涛 |
地址: | 510507 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 信息 监测 关键词 发现 方法 系统 电子设备 | ||
1.一种基于信息监测的关键词发现方法,其特征在于,所述关键词发现方法包括如下步骤:
步骤S101、监测计划调度模块将监测词汇导入给监测目标获取模块使用;
步骤S102、所述监测目标获取模块通过监测计划中设定的搜索引擎,用监测词汇作为搜索引擎的搜索词汇进行搜索,并将搜索结果交给所述监测内容采集模块进行下一步的处理;
步骤S103、所述监测内容采集模块对域名下的网站使用定向爬虫获取网站的内容,将通过所述爬取所获得的所述网页的正文发送给所述建立词集模块进行处理;
步骤S104、所述建立词集模块对所述网页的正文进行处理,将生成的词库发送给关键词推荐管理模块处理;
步骤S105、所述关键词推荐管理模块使用关键词推荐算法对所述词库中的词语进行训练,求解相似度并获得关键词因子,将所述关键词因子进行排列组合,并把排列组合后的关键词因子发送至所述人工审计模块;
步骤S106、所述人工审计模块将所述排列组合后的关键词因子,交给审核人员进行人工审核,并根据人工审核结果,将关键词因子添加至关键词策略模块和/或关键词知识库中。
2.根据权利要求1所述的关键词发现方法,其特征在于,步骤S102中所述用监测词汇作为搜索引擎的搜索词汇进行搜索,具体包括:把每个搜索引擎的前10条搜索结果,根据域名去重。
3.根据权利要求1所述的关键词发现方法,其特征在于,获取网站的所述内容中包括网页的正文以及网页上的链接。
4.根据权利要求1所述的关键词发现方法,其特征在于,步骤S103中将通过所述爬取所获得的所述网页的正文发送给所述建立词集模块进行处理之前还包括:
将所述网页上的链接指向网页的正文和链接进行爬取,并不断重复所述爬取步骤,直至到达所述监测计划调度模块中设置的爬取层次为止。
5.根据权利要求1所述的关键词发现方法,其特征在于,步骤S104中将生成的词库发送给关键词推荐管理模块处理之前还包括:
根据句子或者段落对所述网页的正文进行划分,并使用分词工具进行分词处理,在去除其中重复的词汇后生成词库。
6.根据权利要求1所述的关键词发现方法,其特征在于,步骤S105中所述求解相似度并获得关键词因子,具体包括:
将每次计算后得到的关键词因子进行去重处理,并不断重复进行所述求解相似度和所述去重处理计算,直至所获得的关键词因子个数到达所述监测计划调度模块中设定的关键词因子个数。
7.根据权利要求1所述的关键词发现方法,其特征在于,步骤S106中所述根据人工审核结果,将关键词因子添加至关键词策略模块和/或关键词知识库中,具体包括:
若人工审核结果为有效,则将有效的所述排列组合后的关键词因子添加到关键词策略模块和关键词知识库中;
若人工审核结果为无效,则将无效的所述排列组合后的关键词因子添加到所述关键词知识库中。
8.一种用于实现权利要求1至7之一方法的关键词发现系统,其特征在于,所述关键词发现系统包括:监测计划调度模块、监测目标获取模块、监测内容采集模块、搜索引擎、建立词集模块、关键词推荐管理模块、人工审计模块、关键词策略模块以及关键词知识库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中数通信息有限公司,未经中数通信息有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010944647.5/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置