[发明专利]文本分析方法及系统在审
申请号: | 202111103923.6 | 申请日: | 2021-09-18 |
公开(公告)号: | CN113806542A | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 李保敏 | 申请(专利权)人: | 上海幻电信息科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F16/953;G06F40/30 |
代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 王勇;邓小玲 |
地址: | 200120 上海市浦东新区中国(上海)*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 分析 方法 系统 | ||
1.一种文本分析方法,其特征在于,所述方法包括:
将目标文本输入到文本分析模型中,得到各个文本类别标签的概率系数;其中,所述文本分析模型为预先训练好的并用于分析文本类别的模型;
根据所述目标文本关联对象的历史数据,调整所述各个文本类别标签的概率系数;及
根据调整后的各个文本类别标签的概率系数,获取所述目标文本的文本分析结果。
2.根据权利要求1所述的文本分析方法,其特征在于,所述历史数据包括多个历史文本的类别,其中,所述类别包括第一类别和其他类别;所述根据所述目标文本关联对象的历史数据,调整所述各个文本类别标签的概率系数,包括:
根据所述第一类别的数量和所述多个历史文本的数量,获取所述第一类别的出现概率;及
根据所述第一类别的出现概率,调整与所述第一类别对应的文本类别标签的概率系数。
3.根据权利要求1所述的文本分析方法,其特征在于,
所述方法还包括:分析所述目标文本中多个子句的子句分析结果;
相应的,所述根据调整后的各个文本类别标签的概率系数,获取所述目标文本的文本分析结果,包括:根据所述目标文本中各个子句的子句分析结果以及所述调整后的各个文本类别标签的概率系数,获取所述目标文本的所述文本分析结果。
4.根据权利要求3所述的文本分析方法,其特征在于,所述分析所述目标文本中多个子句的子句分析结果,包括:
从所述目标文本中分割出所述多个子句;
将所述多个子句各输入到所述文本分析模型中,得到所述各个子句的各个子句类别标签的概率系数;及
根据所述各个子句的各个子句类别标签的概率系数,获取所述各个子句类别标签的综合概率系数,其中所述各个子句类别标签的综合概率系数为所述子句分析结果。
5.根据权利要求4所述的文本分析方法,其特征在于,所述根据所述各个子句的各个子句类别标签的概率系数,获取所述各个子句类别标签的综合概率系数,包括:
将所述各个子句分别输入到反向检测模型中,得到所述各个子句的反向检测结果;其中,所述反向检测模型为预先训练好的并用于分析正向/反向表达的模型;
根据所述各个子句的反向检测结果,调整所述各个子句的各个子句类别标签的概率系数;及
根据调整后的所述各个子句的各个子句类别标签的概率系数,获取所述各个子句类别标签的综合概率系数。
6.根据权利要求1至5任意一项所述的文本分析方法,其特征在于,还包括:
收集多个训练文本;
基于所述多个训练文本对BERT模型进行训练,得到初步文本分析模型;
基于转折词构造多个训练样本;及
进行所述多个训练样本对所述初步文本分析模型进行再次训练,得到所述文本分析模型。
7.根据权利要求6所述的文本分析方法,其特征在于,所述基于转折词构造多个训练样本,包括:
获取包括转折词的待构造文本;
获取所述待构造文本的目标部分,所述目标部分为位于转折词之后的文本内容;及
将所述目标部分添加到所述待构造文本的尾部,得到用于所述再次训练的训练样本。
8.一种文本分析系统,其特征在于,所述系统包括:
输入模块,用于:将目标文本输入到文本分析模型中,得到各个文本类别标签的概率系数;其中,所述文本分析模型为预先训练好的并用于分析文本类别的模型;
调整模块,用于:根据所述目标文本关联对象的历史数据,调整所述各个文本类别标签的概率系数;及
获取模块,用于:根据调整后的各个文本类别标签的概率系数,获取所述目标文本的文本分析结果。
9.一种计算机设备,所述计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时用于实现权利要求1至7中任意一项所述的文本分析方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行权利要求1至7中任意一项所述的文本分析方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海幻电信息科技有限公司,未经上海幻电信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111103923.6/1.html,转载请声明来源钻瓜专利网。