[发明专利]一种基于可读性指标的信息检索方法有效

专利信息
申请号: 201510976829.X 申请日: 2015-12-21
公开(公告)号: CN105630940B 公开(公告)日: 2019-03-22
发明(设计)人: 张程;宋大为;张鹏;王博;张文雅 申请(专利权)人: 天津大学
主分类号: G06F16/33 分类号: G06F16/33;G06F16/34
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 李丽萍
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于可读性指标的信息检索方法,使用搜索引擎搜索过程中,对符合搜索条件的文档按照其与查询的关键字的相关度进行排序,同时将符合搜索条件的文档、相关度排序和可读性得分组织成页面返回给用户,文本可读性得分=M×(N×中文平均笔画数+(1‑N)×中文难词频度)+(1‑M)×(P×英文平均字符数+(1‑P)×英文难词频度),M调整中英文可读性的权重配比,N调整中文平均笔画数指标以及中文难词频度指标之间的权重配比,P调整英文平均字符数指标和英文难词频度指标之间的权重配比。本发明通过检索后返回文档的可读性得分,用户便于快速提取相关度较高文档中对于自身而言较为可读的部分,增加检索效率。
搜索关键词: 一种 基于 可读性 指标 信息 检索 方法
【主权项】:
1.一种基于可读性指标的信息检索方法,其特征在于:包括以下步骤:步骤一、当用户使用搜索引擎以希望查询的关键字进行搜索时,搜索引擎从索引中检索出符合搜索条件的文档;步骤二、搜索引擎在搜索过程中,对符合搜索条件的文档按照其与查询的关键字的相关度进行排序,同时进行文本可读性得分的计算,将符合搜索条件的文档、相关度排序和可读性得分组织成页面返回给用户;其中可读性得分按照如下方法计算:文本可读性=M×(N×中文平均笔画数+(1‑N)×中文难词频度)+(1‑M)×(P×英文平均字符数+(1‑P)×英文难词频度)式中,对于文档中同时出现英文以及中文的情况下,可调参数M,负责调整对于该文档中中英文可读性的权重配比;可调参数N,负责调整文档中中文部分的中文平均笔画数指标以及中文难词频度指标之间的权重配比;可调参数P,负责调整文档中英文部分的英文平均字符数指标和英文难词频度指标之间的权重配比。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510976829.X/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top