[发明专利]用于鉴别网页标题与正文关联度的系统及方法有效
申请号: | 201710516064.0 | 申请日: | 2017-06-29 |
公开(公告)号: | CN107357781B | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 胡玥莹 | 申请(专利权)人: | 上海财兔信息科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/205;G06F16/958 |
代理公司: | 上海宏京知识产权代理事务所(普通合伙) 31297 | 代理人: | 闫亚 |
地址: | 202150 上海市崇明区城桥镇秀山*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了用于鉴别网页标题与正文关联度的系统及方法,涉及网络通信技术领域,系统包括:链接提取单元,用于提取链接信息;关键词单元,用于提取光标指向的标题信息,提取标题信息中的多个关键词,并根据链接信息在后台打开正文以提取正文信息;判断单元,判断标题信息的句型,句型包括陈述句、问句;关联度计算单元,用于计算关键词在正文信息中出现的频次,根据标题信息的句型计算关键词在正文信息中的权重;显示单元,用于在标题旁显示频次和权重;其中,光标在标题上停留时间超过预定时间后,系统启动。网友将光标移动到标题处,就能够得到标题与其所指向的正文内容的关联度信息从而替网友筛选无效垃圾信息以避免浪费阅读时间。 | ||
搜索关键词: | 用于 鉴别 网页 标题 正文 关联 系统 方法 | ||
【主权项】:
用于鉴别网页标题与正文关联度的系统,其中,鼠标的光标指向一标题,所述标题包括用于打开与所述标题相关联的正文的链接信息,所述系统包括:链接提取单元,用于提取所述链接信息;关键词单元,用于提取所述光标指向的所述标题的标题信息,提取所述标题信息中的多个关键词,并根据所述链接信息在后台打开所述正文以提取正文信息;判断单元,判断所述标题信息的句型,所述句型包括陈述句、问句;关联度计算单元,用于计算所述关键词在所述正文信息中出现的频次,根据所述标题信息的句型计算所述关键词在所述正文信息中的权重;显示单元,用于在所述标题旁显示所述频次和所述权重;其中,所述光标在所述标题上停留时间超过预定时长后,所述系统启动。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海财兔信息科技有限公司,未经上海财兔信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710516064.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种针对中医药症状句子的中文分词方法
- 下一篇:一种识别用户性别的方法及终端