[发明专利]文本分析方法及系统在审
申请号: | 202111103923.6 | 申请日: | 2021-09-18 |
公开(公告)号: | CN113806542A | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 李保敏 | 申请(专利权)人: | 上海幻电信息科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F16/953;G06F40/30 |
代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 王勇;邓小玲 |
地址: | 200120 上海市浦东新区中国(上海)*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 分析 方法 系统 | ||
本申请公开了一种文本分析方法,所述方法包括:将目标文本输入到文本分析模型中,得到各个文本类别标签的概率系数;其中,所述文本分析模型为预先训练好的并用于分析文本类别的模型;根据所述目标文本关联对象的历史数据,调整所述各个文本类别标签的概率系数;及根据调整后的各个文本类别标签的概率系数,获取所述目标文本的文本分析结果。本申请提供的技术方案,通过训练好的文本分析模型可以获取文本的语义信息,进行深层次的分析以有效提高分析准确性;通过融入所述目标文本关联对象的历史数据,基于该历史数据对文本分析模型的输出进行调整,进一步地有效提高分析准确性。
技术领域
本申请涉及人工智能领域,尤其涉及一种文本分析方法、系统、计算机设备和计算机可读存储介质。
背景技术
随着互联网和大数据的发展,文本分析技术成为各方关注的重点,其可以用于各种场景中。在现有技术中,主要通过关键词、机器学习和深度学习等进行文本分析。但是,上述文本分析具有如下缺陷:准确度不高,无法满足实际需要。
发明内容
本申请实施例的目的是提供一种文本分析方法、系统、计算机设备及计算机可读存储介质,用于解决上述问题。
本申请实施例的一个方面提供了一种文本分析方法,所述方法包括:
将目标文本输入到文本分析模型中,得到各个文本类别标签的概率系数;其中,所述文本分析模型为预先训练好的并用于分析文本类别的模型;
根据所述目标文本关联对象的历史数据,调整所述各个文本类别标签的概率系数;及
根据调整后的各个文本类别标签的概率系数,获取所述目标文本的文本分析结果。
可选的,所述历史数据包括多个历史文本的类别,所述类别包括第一类别和其他类别;所述根据所述目标文本关联对象的历史数据,调整所述各个文本类别标签的概率系数,包括:
根据所述第一类别的数量和所述多个历史文本的数量,获取所述第一类别的出现概率;及
根据所述第一类别的出现概率,调整与所述第一类别对应的文本类别标签的概率系数。
可选的,所述方法还包括:分析所述目标文本中多个子句的子句分析结果;
相应的,所述根据调整后的各个文本类别标签的概率系数,获取所述目标文本的文本分析结果,包括:根据所述目标文本中各个子句的子句分析结果以及所述调整后的各个文本类别标签的概率系数,获取所述目标文本的所述文本分析结果。
可选的所述分析所述目标文本中多个子句的子句分析结果,包括:
从所述目标文本中分割出所述多个子句;
将所述多个子句各输入到所述文本分析模型中,得到所述各个子句的各个子句类别标签的概率系数;及
根据所述各个子句的各个子句类别标签的概率系数,获取所述各个子句类别标签的综合概率系数,其中所述各个子句类别标签的综合概率系数为所述子句分析结果。
可选的所述根据所述各个子句的各个子句类别标签的概率系数,获取所述各个子句类别标签的综合概率系数,包括:
将所述各个子句分别输入到反向检测模型中,得到所述各个子句的反向检测结果;其中,所述反向检测模型为预先训练好的并用于分析正向/反向表达的模型;
根据所述各个子句的反向检测结果,调整所述各个子句的各个子句类别标签的概率系数;及
根据调整后的所述各个子句的各个子句类别标签的概率系数,获取所述各个子句类别标签的综合概率系数。
可选的,还包括:
收集多个训练文本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海幻电信息科技有限公司,未经上海幻电信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111103923.6/2.html,转载请声明来源钻瓜专利网。