[发明专利]文本复述方法、装置、服务器及存储介质有效
申请号: | 201810550596.0 | 申请日: | 2018-05-31 |
公开(公告)号: | CN110555203B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 蒋帅 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/247 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 复述 方法 装置 服务器 存储 介质 | ||
本发明实施例公开了一种文本复述方法、装置、服务器及存储介质。该方法包括:针对原始文本中每一原始语句,依据该原始语句中包含的各原始词语的同义词语以及预先确定的不同词语连续出现的概率,对该原始语句中各原始词语的同义词语进行筛选;顺序连接该原始语句中各原始词语的同义词语得到该原始语句的复述语句。本发明实施例提供的技术方案,减少了对人工的依赖性,提高了文本复述的效率。
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种文本复述方法、装置、服务器及存储介质。
背景技术
信息时代,数据变得越来越重要。因此在内容生态建设的背景下,构建自己特有的内容资源十分重要,而文本复述是构建内容资源的重要途径。
目前主要通过人工编辑的方式对文章进行复述,但是人工复述存在如下缺陷:造成大量人力财力的消耗;偏主观性,不同的主观偏见往往会影响文本复述的最终效果;局限性,由于人力有限,往往不能对所有的文本进行复述;复杂低效,成本高且效能低。因此,提供一种不依赖于人的新的文本复述方法是十分必要的。
发明内容
本发明实施例提供一种文本复述方法、装置、服务器及存储介质,减少了对人工的依赖性,提高了文本复述的效率。
第一方面,本发明实施例提供了一种文本复述方法,该方法包括:
针对原始文本中每一原始语句,依据该原始语句中包含的各原始词语的同义词语以及预先确定的不同词语连续出现的概率,对该原始语句中各原始词语的同义词语进行筛选;
顺序连接该原始语句中各原始词语的同义词语得到该原始语句的复述语句。
第二方面,本发明实施例还提供了一种文本复述装置,该装置包括:
同义词筛选模块,用于针对原始文本中每一原始语句,依据该原始语句中包含的各原始词语的同义词语以及预先确定的不同词语连续出现的概率,对该原始语句中各原始词语的同义词语进行筛选;
复述语句确定模块,用于顺序连接该原始语句中各原始词语的同义词语得到该原始语句的复述语句。
第三方面,本发明实施例还提供了一种服务器,该服务器包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现第一方面中任意所述的文本复述方法。
第四方面,本发明实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面中任意所述的文本复述方法。
本发明实施例提供的文本复述方法、装置、服务器及存储介质,对要进行文本复述的原始文本中每一原始语句,依据该原始语句中包含的各原始词语的同义词语以及预先确定的不同词语连续出现的概率,对该原始语句中各原始词语的同义词语进行筛选,并将筛选后的各原始词语的同义词语顺序连接得到该原始语句的复述语句,进而得到原始文本的复述文本。该方法减少了对人工的依赖性,在规避版权风险的同时,提高了文本复述的效率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1是本发明实施例一中提供的一种文本复述方法的流程图;
图2A是本发明实施例二中提供的一种文本复述方法的流程图;
图2B是本发明实施例二中提供的一种文本复述的架构示意图;
图3是本发明实施例三中提供的一种文本复述方法的流程图;
图4是本发明实施例四中提供的一种文本复述装置的结构框图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810550596.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:文摘播报的生成方法和设备
- 下一篇:情绪判断的方法和装置