[发明专利]用于文本分析的模型训练方法、文本分类方法和装置有效
申请号: | 201910176632.6 | 申请日: | 2019-03-08 |
公开(公告)号: | CN110046248B | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 蒋亮;张家兴;温祖杰;梁忠平 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 孙欣欣;周良玉 |
地址: | 开曼群岛大开曼岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 文本 分析 模型 训练 方法 分类 装置 | ||
1.一种用于文本分析的模型训练方法,所述方法包括:
利用第一双向转换器模型,针对第一训练语句中的每个词,基于该词的初始词向量,以及该词在所述第一训练语句中的上文信息,得到该词对应的正向向量;
利用所述第一双向转换器模型,针对所述第一训练语句中的每个词,基于该词的初始词向量,以及该词在所述第一训练语句中的下文信息,得到该词对应的反向向量;
根据所述第一训练语句中的每个词的位置,将该位置的前一个词的正向向量和该位置的后一个词的反向向量拼接起来,作为该位置对应的目标词向量;
利用第一语言模型,针对所述第一训练语句中每个位置对应的目标词向量,预测得到该位置对应的词的第一概率;
通过使与所述第一概率相关的第一损失函数极小化,对所述第一双向转换器模型和所述第一语言模型进行训练,得到训练后的第二双向转换器模型和第二语言模型;
利用所述第二双向转换器模型,针对第二训练语句中的每个词,基于该词的初始词向量,以及该词在所述第二训练语句中的上文信息,得到该词对应的正向向量;
利用所述第二双向转换器模型,针对所述第二训练语句中的每个词,基于该词的初始词向量,以及该词在所述第二训练语句中的下文信息,得到该词对应的反向向量;
根据所述第二训练语句中的每个词的位置,将该位置的前一个词的正向向量和该位置的后一个词的反向向量拼接起来,作为该位置对应的目标词向量;
利用所述第二语言模型,针对所述第二训练语句中每个位置对应的目标词向量,预测得到该位置对应的词的第一概率;以及,根据所述第二训练语句中每个位置对应的目标词向量,生成所述第二训练语句对应的句子的表示向量;
利用多分类模型,基于所述第二训练语句对应的句子的表示向量,预测所述第二训练语句对应标签的第二概率;
通过使第一损失函数与第二损失函数的和极小化,对所述第二双向转换器模型、所述第二语言模型和所述多分类模型进行训练,得到第三双向转换器模型、第三语言模型和第二多分类模型;其中,所述第一损失函数与所述第一概率相关,所述第二损失函数与所述第二概率相关。
2.如权利要求1所述的方法,其中,所述利用所述第二双向转换器模型,针对所述第二训练语句中的每个词,基于该词的初始词向量,以及该词在所述第二训练语句中的下文信息,得到该词对应的反向向量,包括:
利用所述第二双向转换器模型,针对所述第二训练语句中的每个词,使用自注意力机制,基于该词的初始词向量,以及该词在所述第二训练语句中的下文信息,从不同角度抽取多个重要信息;
将所述多个重要信息中每个重要信息对应的向量进行拼接,得到该词对应的反向向量。
3.如权利要求1所述的方法,其中,所述根据所述第二训练语句中每个位置对应的目标词向量,生成所述第二训练语句对应的句子的表示向量,包括:
将所述第二训练语句中每个位置对应的目标词向量取均值,将所述均值作为所述第二训练语句对应的句子的表示向量。
4.如权利要求1所述的方法,其中,所述通过使所述第一损失函数与第二损失函数的和极小化,对所述第二双向转换器模型、所述第二语言模型和所述多分类模型进行训练,包括:
通过梯度下降法使所述第一损失函数与第二损失函数的和极小化,以确定所述第二双向转换器模型、所述第二语言模型和所述多分类模型的模型参数。
5.一种文本分类方法,所述方法包括:
利用如权利要求1所述的方法训练后的所述第三双向转换器模型,针对待分类语句中的每个词,基于该词的初始词向量,以及该词在所述待分类语句中的上文信息,得到该词对应的正向向量;
利用所述第三双向转换器模型,针对所述待分类语句中的每个词,基于该词的初始词向量,以及该词在所述待分类语句中的下文信息,得到该词对应的反向向量;
根据所述待分类语句中的每个词的位置,将该位置的前一个词的正向向量和该位置的后一个词的反向向量拼接起来,作为该位置对应的目标词向量;
根据所述待分类语句中每个位置对应的目标词向量,生成所述待分类语句对应的句子的表示向量;
利用如权利要求1所述的方法训练后的所述第二多分类模型,基于所述待分类语句对应的句子的表示向量,对所述待分类语句进行文本分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910176632.6/1.html,转载请声明来源钻瓜专利网。