[发明专利]一种页面权威值的识别方法、装置、设备和存储介质在审
| 申请号: | 202010947270.9 | 申请日: | 2020-09-10 | 
| 公开(公告)号: | CN111966946A | 公开(公告)日: | 2020-11-20 | 
| 发明(设计)人: | 郑小裕;刘昊;和为;刘准;何伯磊;李雅楠 | 申请(专利权)人: | 北京百度网讯科技有限公司 | 
| 主分类号: | G06F16/958 | 分类号: | G06F16/958;G06F16/9535;G06K9/62;G06N20/00 | 
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 | 
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 页面 权威 识别 方法 装置 设备 存储 介质 | ||
本申请公开了一种页面权威值的识别方法、装置、设备和存储介质,涉及自然语言处理和深度学习技术领域。具体实现方案为:获取页面的页面属性特征、页面所属空间特征和页面链指关系特征;将所述页面属性特征、页面所属空间特征和页面链指关系特征输入至预先训练的页面权威值识别模型中,输出所述页面的权威值。该页面权威值的识别方法能够实现对页面的重要性分析,将真正高质量高权威的页面反馈给用户,从而辅助用户对页面的有效利用。
技术领域
本申请涉及计算机技术领域,尤其人工智能和深度学习技术,具体涉及一种页面权威值的识别方法、装置、设备和存储介质。
背景技术
随着互联网技术的发展,线上办公、电子化办公的发展趋势明显。以企业为例,当企业经过多年的运作,会以一定载体积累大量的生产、研发、运营、工作的经验与知识,包括各种规章制度、项目文档、和工作经验等文档,成为企业日积月累的知识财富。这些各种内容的文档,可以通过电子页面的形式进行创建、多人协同编辑、保存和浏览。典型例子如企业级wiki系统,即企业级多人协作的写作系统。
当页面积累数量过多时,就会为用户提供页面搜索、推荐等服务功能,这些功能均需要了解页面的价值、重要性,才能够为用户提供更适合的知识信息。
因此,需要提供一种能够有效对页面重要性和价值进行评估和展现的技术方案。
发明内容
本申请实施例提供了一种页面权威值的识别方法、装置、设备和存储介质,以有效地识别和展现页面的重要性和价值。
第一方面,本申请实施例提供了一种页面权威值的识别方法,该方法包括:
获取页面的页面属性特征、页面所属空间特征和页面链指关系特征;
将所述页面属性特征、页面所属空间特征和页面链指关系特征输入至预先训练的页面权威值识别模型中,输出所述页面的权威值。
第二方面,本申请实施例提供了一种页面权威值的识别装置,该装置包括:
特征获取模块,用于获取页面的页面属性特征、页面所属空间特征和页面链指关系特征;
权威值确定模块,用于将所述页面属性特征、页面所属空间特征和页面链指关系特征输入至预先训练的页面权威值识别模型中,输出所述页面的权威值。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本申请任意实施例所述的页面权威值的识别方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本申请任意实施例所述的页面权威值的识别方法。
本申请实施例提供了一种页面权威值的识别方法、装置、设备和存储介质,获取页面的页面属性特征、页面所属空间特征和页面链指关系特征;将所述页面属性特征、页面所属空间特征和页面链指关系特征输入至预先训练的页面权威值识别模型中,输出所述页面的权威值。该页面权威值的识别方法能够实现全面、多维度对页面的重要性分析,将真正高质量、高权威的页面反馈给用户,从而辅助用户对页面的有效利用。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1A是本申请实施例的一种页面权威值的识别方法的示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010947270.9/2.html,转载请声明来源钻瓜专利网。





