[发明专利]一种小说网页智能摘要的生成方法与系统在审
| 申请号: | 201410806642.0 | 申请日: | 2014-12-22 |
| 公开(公告)号: | CN105786837A | 公开(公告)日: | 2016-07-20 |
| 发明(设计)人: | 董毅;张前川;陈营营;张川;魏文华 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 李相雨 |
| 地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 小说 网页 智能 摘要 生成 方法 系统 | ||
技术领域
本发明涉及搜索技术领域,尤其涉及一种小说网页智能摘要的生 成方法与系统。
背景技术
随着国内互联网技术的迅速发展,如何在互联网上快速准确的找 到自己所需要的信息,成为互联网搜索中的一个关键问题。
在现有的搜索结果页显示中,一般是按照关键词与服务器中存储 的关键词的匹配程度来进行排序显示,或者通过统计用户对该关键词 的网页的历史点击率进行排序显示。但是,在通过上述排序得到的搜 索结果页中,如果仅仅呈现的是各个搜索结果项以及搜索结果项的相 关简介,需要用户一一查看搜索结果项的简介才能找到感兴趣的搜索 内容,因而就有了在搜索结果列表中显示网页摘要的需求。
如何提供一种生成搜索结果的摘要的方法,使得摘要能够较好 的满足用户的查询需求,以及包含较多的真正是用户需要的相关信 息,成为目前急需解决的问题之一。因此,上述搜索结果页生成或 者显示方法不能快速有效的为用户提供想要的内容。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至 少部分地解决或者减缓上述问题的一种小说网页智能摘要的生成方 法和相应的一种小说网页智能摘要的生成系统。
根据本发明的一个方面,提供了一种小说网页智能摘要的生成方 法,包括步骤:
解析小说网页meta标签中是否存在第三方自定义的一个或多个 字段数据;
如果存在,则提取所述一个或多个字段数据,与搜索结果列表页 中的预设位置对应的类型相匹配;
将所述一个或多个字段数据按照类型分配到所述搜索结果列表 页中的预设位置以生成智能摘要。
进一步地,该方法在解析小说网页meta标签中是否存在第三方自 定义的一个或多个字段数据之前,还包括通过第三方在超文本文档源 代码的头部部分添加以预定辅助标签标识的一个或多个字段数据。
进一步地,所述步骤将所述一个或多个字段数据按照类型分配到 所述搜索结果列表页中的预设位置以生成智能摘要,进一步包括:
根据字段标识信息从第三方自定义的一个或多个字段数据中识 别小说的封面图片URL字段、小说标题字段、小说简介字段、小说的 目录页地址字段、小说的更新状态字段、小说的最新章节标题字段和 /或小说的最新章节对应的URL字段;
根据识别的各个字段在搜索结果列表中生成智能摘要。
进一步地,所述步骤通过第三方在超文本文档源代码的头部部分 添加以预定辅助标签标识的一个或多个字段数据,进一步包括:对在 第三方自定义的所述一个或多个字段数据中的每个字段确定重要度;
根据重要度利用第三方自定义的所述一个或多个字段数据在搜 索结果列表中生成小说网页智能摘要。
进一步地,该方法还包括:根据第三方自定义的所述一个或多个 字段数据在搜索结果列表中的预定区域内显示小说网页智能摘要。
进一步地,所述步骤根据第三方自定义的所述一个或多个字段数 据在搜索结果列表中的预定区域内显示小说网页智能摘要,进一步包 括:在所述预定区域的左侧显示图片。
具体地,所述第三方为网站管理者或者网页提供者。
根据本发明的另一个方面,提供了一种小说网页智能摘要的生成 系统,该系统包括:
字段数据解析单元,用于解析小说网页meta标签中是否存在第三 方自定义的一个或多个字段数据;
字段提取匹配单元,用于如果存在,则提取所述一个或多个字段 数据,与搜索结果列表页中的预设位置对应的类型相匹配;
智能摘要生成单元,用于将所述一个或多个字段数据按照类型分 配到所述搜索结果列表页中的预设位置以生成智能摘要。
进一步地,该系统还包括:字段数据添加单元,用于通过第三方 在超文本文档源代码的头部部分添加以预定辅助标签标识的一个或 多个字段数据。
进一步地,所述智能摘要生成单元,进一步包括:
字段识别子单元,用于根据字段标识信息从第三方自定义的一个 或多个字段数据中识别小说的封面图片URL字段、小说标题字段、小 说简介字段、小说的目录页地址字段、小说的更新状态字段、小说的 最新章节标题字段和/或小说的最新章节对应的URL字段;
第一智能摘要生成子单元,用于根据识别的各个字段在搜索结果 列表中生成智能摘要。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410806642.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多功能网页活动室
- 下一篇:一种网页元素碰撞判断方法及装置





