[发明专利]一种文本处理方法、装置、设备及可读存储介质有效
申请号: | 201910521610.9 | 申请日: | 2019-06-17 |
公开(公告)号: | CN110209772B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 刘加新;刘琴;方逸群;胡加学 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杨华 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 处理 方法 装置 设备 可读 存储 介质 | ||
本申请公开了一种文本处理方法、装置、设备及可存储介质,针对任一段材料文本,在获取该材料文本所属的目标业务场景后,进一步获取材料文本中包含的与目标业务场景相关的关键信息。基于目标业务场景下,文本片段的特征信息和关键信息的特征信息,确定关键要素间的依存关系。其中,关键要素包括关键信息和材料文本中所包含的与目标业务场景相关的文本片段。显然,关键要素包括的文本片段和关键信息均为对理解材料文本有价值的信息。所以,本方案提供的文本处理方法基于文本片段的特征信息和关键信息的特征信息,所确定的关键要素间的依存关系可以表征材料文本中的各有价值信息之间的联系。
技术领域
本申请涉及自然语言处理领域,更具体地说,涉及一种文本处理方法、装置、设备及可读存储介质。
背景技术
在飞速发展的信息时代,信息日益成为社会各领域中最活跃、最具有决定意义的因素。在海量数据组成的信息材料中存在大量的有价值信息,有价值信息指的是对信息材料的分析与理解具有重要作用的信息,可以理解的是,有价值信息之间存在不同程度的联系。显然,有价值信息及其之间的联系对于信息材料的分析与理解至关重要。
例如,在社会生活的各个领域,人们接触的信息材料中可能包括大量且晦涩难懂的数据,以电子产品为例,在电子产品的使用说明书中往往包括专业的工作原理、复杂的数字以及注意事项。显然,仅依靠人的阅读难以在短时间内筛选出对理解该使用说明书有帮助的有价值信息,以及有价值信息之间的联系。
综上,如何快速准确提取信息材料中有价值信息及其之间联系是本领域技术人员的技术难题。
发明内容
有鉴于此,本申请提供了一种文本处理方法装置、设备及可读存储介质,可以在材料信息中提取有价值信息,且获取有价值信息之间的依存关系。
为了实现上述目的,现提出的方案如下:
一种文本处理方法,包括:
获取材料文本所属的目标业务场景,所述材料文本由文本片段组成;
获取所述材料文本包含的与所述目标业务场景相关的关键信息;
基于所述目标业务场景下,所述文本片段的特征信息和所述关键信息的特征信息,确定关键要素间的依存关系,所述关键要素包括所述材料文本中的文本片段及所述关键信息。
优选地,本方法还包括:
基于所述关键要素间的依存关系建立语义树,所述语义树的根结点表示所述目标业务场景,子结点表示所述关键要素,两个子结点间的弧表示所述两个子结点对应的关键要素间的依存关系。
优选地,基于所述目标业务场景下,所述文本片段的特征信息和所述关键信息的特征信息,确定关键要素间的依存关系,包括:
基于当前解析环境的特征信息,确定当前的转移动作;当前解析环境c=[ST,S,K,A],其中ST用于存储所述目标业务场景,及响应转移动作的解析,暂存所确定的关键要素;S用于存储未处理的文本片段;K用于存储未处理的关键信息;A用于存储确定的存在依存关系的关键要素对;
解析当前的转移动作,以更新当前解析环境,得到更新后的解析环境,并以更新后的解析环境作为新的当前解析环境,返回执行确定当前的转移动作的步骤,直至S和K为空,且ST中不存在关键要素为止,得到最后一次更新后的解析环境中的A存储的关键要素间的依存关系。
优选地,基于当前解析环境的特征信息,确定当前的转移动作,包括:
将当前解析环境输入预置的转移动作解析模型,得到转移动作解析模型输出的当前的转移动作;
所述转移动作解析模型被配置为,接收输入的解析环境,并基于解析环境的特征信息进行处理,以生成对应的转移动作的内部状态表示。
优选地,转移动作至少包括二类,分别为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910521610.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用户地理信息分析与文本挖掘方法和装置
- 下一篇:一种基于问答系统的问答装置