[发明专利]文档分章方法及装置、终端和计算机可读存储介质有效
申请号: | 201910989926.0 | 申请日: | 2019-10-17 |
公开(公告)号: | CN110717323B | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 张云帆;李红;何健秋 | 申请(专利权)人: | 北京幻想纵横网络技术有限公司 |
主分类号: | G06F40/186 | 分类号: | G06F40/186;G06F40/103;G06F16/31;G06F9/451 |
代理公司: | 北京乐知新创知识产权代理事务所(普通合伙) 11734 | 代理人: | 江宇 |
地址: | 100000 北京市海淀区农*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 方法 装置 终端 计算机 可读 存储 介质 | ||
本发明公开了一种文档分章方法及装置、终端和计算机可读存储介质,该方法包括:获取针对目标文档的文档读取指令;基于所述文档读取指令,启动阅读线程和分章线程;在所述阅读线程中,读取所述目标文档的第一部分;在所述分章线程中,通过文档分章模型对所述目标文档中所述第一部分后的第二部分进行分章。通过本发明的技术方案,在准确分章的基础上,避免了分章过程影响用户阅读,提升了用户的阅读体验。
技术领域
本发明涉及计算机技术领域,尤其涉及一种文档分章方法及装置、终端和计算机可读存储介质。
背景技术
txt源文件内是没有分章节的,因此,为提升用户阅读体验,可对txt源文件进行分章。相关技术主要通过以下几种方式进行分章:
1、全文匹配有多少换行符“/n”、回车符“/r”或两者结合,就认为全文具有多少章。
2、在全文进行串行搜索,根据关键字“章”、“卷”、“部”等,来提取章节。
然而,这些分章方式过于简略。同一章内也可出现换行符“/n”、回车符“/r”等内容,以此为依据分章很容易造成章节错乱;而串行搜索虽更具准确性,但其搜索过程耗时久,导致打开txt文档缓慢,影响用户的阅读体验。
因此,如何在准确分章的基础上不影响用户的阅读体验,成为目前亟待解决的技术问题。
发明内容
本发明提供一种文档分章方法及装置、终端和计算机可读存储介质,针对相关技术中如何在准确分章的基础上不影响用户的阅读体验的技术问题,在阅读线程之外单独启动了分章线程,可在用户阅读的同时进行后续内容的分章。
本发明第一方面提供一种文档分章方法,包括:获取针对目标文档的文档读取指令;基于所述文档读取指令,启动阅读线程和分章线程;在所述阅读线程中,读取所述目标文档的第一部分;在所述分章线程中,通过文档分章模型对所述目标文档中所述第一部分后的第二部分进行分章。
在本发明上述实施例中,可选地,所述读取所述目标文档的第一部分的步骤,具体包括:经历史访问路径获取所述目标文档;对所述目标文档中位于历史阅读进度位置后的未阅读内容提取文本字符串;基于所述文本字符串和预定显示规则,在人机交互界面显示位于所述未阅读内容内的所述第一部分。
在本发明上述实施例中,可选地,在所述通过文档分章模型对所述目标文档中所述第一部分后的第二部分进行分章的步骤之前,还包括:基于预定的分章字符提取规则,在所述目标文档的所述第二部分中提取待验证分章字符集合;则所述通过文档分章模型对所述目标文档中所述第一部分后的第二部分进行分章的步骤,具体包括:将所述第二部分对应的文本字符串、预定分章字符集合和所述待验证分章字符集合输入所述文档分章模型,并通过所述文档分章模型输出分章结果集合;存储所述分章结果集合;根据所述分章结果集合,刷新人机交互界面中的章节显示区域。
在本发明上述实施例中,可选地,还包括:在满足第一预定条件的情况下,对所述分章结果集合进行更改;在满足第二预定条件的情况下,重启所述分章线程。
在本发明上述实施例中,可选地,建立所述文档分章模型的方式包括:根据接收到的分章规则设置信息,设置所述文档分章模型;或者获取训练样本集合,所述训练样本集合中的每个训练样本包括样本文档文本字符串、样本预定分章字符集合、从所述样本文档文本字符串中提取的样本待验证分章字符集合以及对应的分章结果集合预测值;初始化初始文档分章模型的模型参数;将所述每个训练样本的所述样本文档文本字符串、所述样本预定分章字符集合、从所述样本文档文本字符串中提取的所述样本待验证分章字符集合输入所述初始文档分章模型,得到所述每个训练样本对应的分章结果集合有效值;基于所述每个训练样本的所述分章结果集合有效值和所述分章结果集合预测值的差异,对所述初始文档分章模型的模型参数进行调整,得到所述文档分章模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京幻想纵横网络技术有限公司,未经北京幻想纵横网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910989926.0/2.html,转载请声明来源钻瓜专利网。