[发明专利]一种文本处理方法、装置、设备及介质在审
| 申请号: | 202010687708.4 | 申请日: | 2020-07-16 |
| 公开(公告)号: | CN111859902A | 公开(公告)日: | 2020-10-30 |
| 发明(设计)人: | 何耀平;吴边;柴鹏飞;孟海忠;任宇翔;方成;饶官军;许红伟;洪叶恩;冯辉 | 申请(专利权)人: | 微医云(杭州)控股有限公司 |
| 主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/279;G06F40/30;G06F16/35 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 311200 浙江省杭州市萧山区萧山*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 文本 处理 方法 装置 设备 介质 | ||
1.一种文本处理方法,其特征在于,包括:
将第一对话用户在第一时刻发出的第一对话内容输入至与第一对话用户对应的第一语言模型进行处理,获得第一处理结果;
将所述第一处理结果以及第二对话用户基于所述第一对话内容发出的第二对话内容输入至与第二对话用户对应的第二语言模型进行处理,获得第二处理结果;
基于所述第一处理结果以及所述第二处理结果获取目标处理结果。
2.根据权利要求1所述的方法,其特征在于,所述获得第二处理结果之后,还包括:
将所述第一对话用户基于所述第二对话内容在第二时刻发出的第三对话内容、所述第一处理结果以及所述第二处理结果作为所述第一语言模型的第一输入信息,以使所述第一语言模型基于所述第一输入信息对所述第三对话内容进行处理,获得第三处理结果;
其中,所述第二时刻晚于所述第一时刻。
3.根据权利要求2所述的方法,其特征在于,所述获得第三处理结果之后,还包括:
将所述第二对话用户基于所述第三对话内容发出的第四对话内容、所述第二处理结果以及所述第三处理结果作为所述第二语言模型的第二输入信息,以使所述第二语言模型基于所述第二输入信息对所述第四对话内容进行处理,获得第四处理结果;
对应的,所述基于所述第一处理结果以及所述第二处理结果获取目标处理结果,包括:
基于所述第三处理结果以及所述第四处理结果获取目标处理结果。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述第一语言模型以及所述第二语言模型均包括自注意力self-attention模块,所述第一语言模型与所述第二语言模型的模型结构相同,模型参数不同。
5.根据权利要求1-3任一项所述的方法,其特征在于,在训练阶段,将第一用户的第一对话样本输入第一语言模型,获得第一结果;
将第二用户的第二对话样本输入第二语言模型,获得第二结果;
将所述第一结果与所述第二结果中的最大者与所述最大者对应的样本标注结果进行比对,获得损失值;
将所述损失值反馈至获得所述最大者的语言模型,以使获得所述最大者的语言模型基于所述损失值进行学习。
6.根据权利要求1-3任一项所述的方法,其特征在于,所述目标处理结果包括:情感分析结果或者设定关键词识别结果。
7.一种文本处理装置,其特征在于,包括:
第一处理模块,用于将第一对话用户在第一时刻发出的第一对话内容输入至与第一对话用户对应的第一语言模型进行处理,获得第一处理结果;
第二处理模块,用于将所述第一处理结果以及第二对话用户基于所述第一对话内容发出的第二对话内容输入至与第二对话用户对应的第二语言模型进行处理,获得第二处理结果;
汇总模块,用于基于所述第一处理结果以及所述第二处理结果获取目标处理结果。
8.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一项所述的文本处理方法。
9.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-6中任一项所述的文本处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微医云(杭州)控股有限公司,未经微医云(杭州)控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010687708.4/1.html,转载请声明来源钻瓜专利网。





