[发明专利]文本分块方法和装置在审
| 申请号: | 202211123800.3 | 申请日: | 2022-09-15 |
| 公开(公告)号: | CN115470777A | 公开(公告)日: | 2022-12-13 |
| 发明(设计)人: | 张鹏程 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
| 主分类号: | G06F40/258 | 分类号: | G06F40/258;G06F40/30;G06F40/205;G06F40/166 |
| 代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
| 地址: | 100176 北京市大兴区经济技*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 分块 方法 装置 | ||
本申请公开了文本分块方法和装置,涉及文本处理技术领域。该方法的一具体实施方式包括:提取待分块文本中各段落的元素信息,生成目标一维数组;将目标一维数组中的第一个元素确定为目标元素,执行目标操作。该实施方式实现了对选中文本基于语义的分块操作,提升了编号的合理性和有效性,提升了用户体验。
技术领域
本申请涉及协同办公技术领域,具体涉及文本处理技术领域,尤其涉及一种文本分块方法和装置。
背景技术
随着互联网不断发展,对协同办公软件的要求越来越高,现有富文本编辑器中,可以设置列表样式来对段落进行编号,以便更清晰的罗列内容,默认对选中段落从上到下顺序编号。
发明内容
本申请实施例提供了一种文本分块方法、装置、设备以及存储介质。
根据第一方面,本申请实施例提供了一种文本分块方法,该方法包括:提取待分块文本中各段落的元素信息,生成目标一维数组;将目标一维数组中的第一个元素确定为目标元素,执行目标操作。
根据第二方面,本申请实施例提供了一种文本分块装置,该装置包括:提取模块,被配置成提取待分块文本中各段落的元素信息,生成目标一维数组;分块模块,被配置成将目标一维数组中的第一个元素确定为目标元素,执行目标操作。
根据第三方面,本申请实施例提供了一种电子设备,该电子设备包括一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被该一个或多个处理器执行,使得一个或多个处理器实现如第一方面的任一实施例的文本分块方法。
根据第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面的任一实施例的文本分块方法。
本申请通过提取待分块文本中各段落的元素信息,生成目标一维数组;将目标一维数组中的第一个元素确定为目标元素,执行目标操作,实现了对选中文本基于语义的分块操作,克服了现有技术中单纯依赖缩进级别进行编号用户体验较差的问题,提升了编号的合理性和有效性,提升了用户体验。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其他特征将通过以下的说明书而变得容易理解。
附图说明
图1是本申请可以应用于其中的示例性系统架构图;
图2a是根据本申请的文本分块方法的一个实施例的流程图;
图2b是根据现有技术中的编号方法的一个应用场景的示意图;
图3是根据本申请的文本分块方法的一个实施例的流程图;
图4是根据本申请的文本分块方法的又一个实施例的流程图;
图5是根据本申请的文本分块方法的一个应用场景的示意图;
图6是根据本申请的文本分块方法的又一个实施例的流程图;
图7是根据本申请的文本分块装置的一个实施例的示意图;
图8是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211123800.3/2.html,转载请声明来源钻瓜专利网。





