[发明专利]文档分章方法及装置、终端和计算机可读存储介质有效
| 申请号: | 201910989926.0 | 申请日: | 2019-10-17 | 
| 公开(公告)号: | CN110717323B | 公开(公告)日: | 2020-07-31 | 
| 发明(设计)人: | 张云帆;李红;何健秋 | 申请(专利权)人: | 北京幻想纵横网络技术有限公司 | 
| 主分类号: | G06F40/186 | 分类号: | G06F40/186;G06F40/103;G06F16/31;G06F9/451 | 
| 代理公司: | 北京乐知新创知识产权代理事务所(普通合伙) 11734 | 代理人: | 江宇 | 
| 地址: | 100000 北京市海淀区农*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 文档 方法 装置 终端 计算机 可读 存储 介质 | ||
1.一种文档分章方法,其特征在于,包括:
获取针对目标文档的文档读取指令;
基于所述文档读取指令,启动阅读线程和分章线程;
在所述阅读线程中,读取所述目标文档的第一部分;
在所述分章线程中,通过文档分章模型对所述目标文档中所述第一部分后的第二部分进行分章;
所述读取所述目标文档的第一部分的步骤,具体包括:
经历史访问路径获取所述目标文档;
对所述目标文档中位于历史阅读进度位置后的未阅读内容提取文本字符串;
基于所述文本字符串和预定显示规则,在人机交互界面显示位于所述未阅读内容内的所述第一部分。
2.根据权利要求1所述的文档分章方法,其特征在于,在所述通过文档分章模型对所述目标文档中所述第一部分后的第二部分进行分章的步骤之前,还包括:
基于预定的分章字符提取规则,在所述目标文档的所述第二部分中提取待验证分章字符集合;
则所述通过文档分章模型对所述目标文档中所述第一部分后的第二部分进行分章的步骤,具体包括:
将所述第二部分对应的文本字符串、预定分章字符集合和所述待验证分章字符集合输入所述文档分章模型,并通过所述文档分章模型输出分章结果集合;
存储所述分章结果集合;
根据所述分章结果集合,刷新人机交互界面中的章节显示区域。
3.根据权利要求2所述的文档分章方法,其特征在于,还包括:
在满足第一预定条件的情况下,对所述分章结果集合进行更改;
在满足第二预定条件的情况下,重启所述分章线程。
4.根据权利要求1至3中任一项所述的文档分章方法,其特征在于,建立所述文档分章模型的方式包括:
根据接收到的分章规则设置信息,设置所述文档分章模型;
或者
获取训练样本集合,所述训练样本集合中的每个训练样本包括样本文档文本字符串、样本预定分章字符集合、从所述样本文档文本字符串中提取的样本待验证分章字符集合以及对应的分章结果集合预测值;
初始化初始文档分章模型的模型参数;
将所述每个训练样本的所述样本文档文本字符串、所述样本预定分章字符集合、从所述样本文档文本字符串中提取的所述样本待验证分章字符集合输入所述初始文档分章模型,得到所述每个训练样本对应的分章结果集合有效值;
基于所述每个训练样本的所述分章结果集合有效值和所述分章结果集合预测值的差异,对所述初始文档分章模型的模型参数进行调整,得到所述文档分章模型。
5.一种文档分章装置,其特征在于,包括:
文档读取指令获取单元,用于获取针对目标文档的文档读取指令;
异步线程启动单元,用于基于所述文档读取指令,启动阅读线程和分章线程;
阅读线程运行单元,用于在所述阅读线程中,读取所述目标文档的第一部分;
分章线程运行单元,用于在所述分章线程中,通过文档分章模型对所述目标文档中所述第一部分后的第二部分进行分章;
所述阅读线程运行单元包括:
目标文档获取单元,用于经历史访问路径获取所述目标文档;
字符串提取单元,用于对所述目标文档中位于历史阅读进度位置后的未阅读内容提取文本字符串;
阅读内容显示单元,用于基于所述文本字符串和预定显示规则,在人机交互界面显示位于所述未阅读内容内的所述第一部分。
6.根据权利要求5所述的文档分章装置,其特征在于,还包括:
分章字符提取单元,用于在所述分章线程运行单元进行分章之前,基于预定的分章字符提取规则,在所述目标文档的所述第二部分中提取待验证分章字符集合;
则所述分章线程运行单元包括:
文档分章模型输入单元,用于将所述第二部分对应的文本字符串、预定分章字符集合和所述待验证分章字符集合输入所述文档分章模型;
文档分章模型输出单元,用于通过所述文档分章模型输出分章结果集合;
分章结果集合存储单元,用于存储所述分章结果集合;
章节显示区域刷新单元,用于根据所述分章结果集合,刷新人机交互界面中的章节显示区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京幻想纵横网络技术有限公司,未经北京幻想纵横网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910989926.0/1.html,转载请声明来源钻瓜专利网。





