[发明专利]基于图书阅读行为的图书章节摘要生成方法有效

专利信息
申请号: 201410090143.6 申请日: 2014-03-12
公开(公告)号: CN103885935A 公开(公告)日: 2014-06-25
发明(设计)人: 鲁伟明;安文佳;吴江琴;庄越挺 申请(专利权)人: 浙江大学
主分类号: G06F17/27 分类号: G06F17/27
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 张法高
地址: 310027 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 图书 阅读 行为 章节 摘要 生成 方法
【说明书】:

技术领域

发明涉及文档摘要生成方法,尤其涉及一种基于图书阅读行为的图书章节摘要生成方法。

背景技术

随着数字图书馆的日益发展,用户在阅读图书前,希望能够快速准确的了解图书章节内容信息,迫切希望数字图书馆中能够提供图书章节摘要的服务。

图书章节摘要生成本质上是一种基于阅读行为的文档摘要生成方法,即将用户阅读行为建模,根据行为模型将用户阅读因素加入文档摘要生成算法中,得到受用户阅读影响的摘要结果。如果直接采用传统的文档摘要生成方法,图书章节摘要可能不会从用户阅读角度来准确表达章节内容信息,这样也就无法满足用户的需求。

在传统的阅读中,读者阅读的目标对象是简单确定的语言符号。在阅读的开始和阅读的结束,读者仅仅通过文字化的内容信息获取并得到认知,是一个脱离于社会的鼓励的存在。基于网络的社会化阅读的出现,使阅读者从阅读内容选择的开始到阅读内容结束,部分或全部过程都与社会化网络形成了关联。在这种人与人之间相互关联的社会网络中,读者的阅读行为往往就成为需要关注和研究的对象。

社会化阅读本身是以内容为核心,以社交关系为纽带,注重分享、交流和互动的阅读新模式。用户在内容阅读的过程中,可以与同样喜好的用户进行互动,阅读结束后,可以与阅读同一内容的大众进行交往联系,甚至形成议题融合的社会化。分享、交流和互动贯穿于社会化阅读的全过程。而在这些互动交流中,产生了大量新的有价值的内容,如评论、摘要、笔记、关联或交叉信息。

在进行图书章节摘要生成时所采用的基础摘要生成算法是基于数据重构的文档摘要生成算法(DSDR)。基于数据重构的文档摘要生成算法是一种抽取式的方法,该方法认为好的文档摘要应该满足一个特点:从结果摘要能够最大程度的重构原始文档,即的结果摘要能够尽量的覆盖整个文档所表达的内容信息。

在基于数据重构的文档摘要生成算法的基础上,把用户在社会化阅读时的各种行为考虑进去,比如阅读的时候用户的重要句子圈画行为,这些被圈画的句子往往被认为有比较高的代表性,与其他没有被圈画的句子相比要具有比较高的影响权重。

发明内容

本发明的目的是为了提供能够方便用户快速了解图书章节信息的章节摘要,给出了一种基于图书阅读行为的图书章节摘要生成方法。

本发明解决其技术问题采用的技术方案如下:

基于图书阅读行为的图书章节摘要生成方法的步骤如下:

1)构建图书页面量化阅读行为评分机制:将用户阅读行为按阅读深度由浅到深分为四个层次,分别是浏览层次、收藏层次、浅度阅读层次和深度阅读层次,基于这四个层次得到基于用户阅读行为的图书页面评分机制;

2)句子权重值传播:通过步骤1)的基于用户阅读行为的图书页面评分机制得到图书书页量化得分,将图书章节按句子分割,图书书页量化得分会赋予每个句子初始的权重值,基于句子之间的距离,利用数据流行结构上的排序算法进行句子权重值的传播;

3)图书章节摘要生成:句子权重值得到传播后,将句子权重值加入基于数据重构的文档摘要生成算法中,从图书章节中挑选重要句子作为章节摘要。

所述的步骤1)为:

2.1将用户阅读某页的行为划分为四个层次,分别是浏览层次、收藏层次、浅度阅读层次和深度阅读层次,不同层次对书页有不同的得分贡献;

2.2使用留存率、流失率和评分指数衰减来衡量阅读到达某个层次的难度,以此来进行评分,图书页面用户留存率是指对于某图书页面来讲,相对于浏览时的用户数,进行到收藏、浅度阅读和深度阅读的留存用户数的比例,图书页面用户流失率是指对于上一步留存用户数,这一步所减少的用户数的比例,

建立基于用户阅读行为的评分公式:

Vi=[(pi+qi)/pi]exp(1-pi)  i=1,2,3,4

图书页面用户留存率公式:

pi=Ui/U1  i=1,2,3,4

图书页面用户流失率公式:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410090143.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top