[发明专利]实体关系分类方法、装置、介质及电子设备在审
申请号: | 201911304843.X | 申请日: | 2019-12-17 |
公开(公告)号: | CN112989032A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 王磊;吴新乐 | 申请(专利权)人: | 医渡云(北京)技术有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N20/00 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
地址: | 100191 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 关系 分类 方法 装置 介质 电子设备 | ||
1.一种实体关系分类方法,其特征在于,包括:
根据文本样本所属的类型,将目标类型的文本样本确定为源域数据,将除所述目标类型之外的候选类型的文本样本确定为候选域数据;
将所述源域数据作为训练数据获得第一关系分类模型,并利用所述第一关系分类模型对所述候选域数据进行实体关系分类;
根据所述实体关系分类的分类结果对所述第一关系分类模型再次进行训练,以获取目标关系分类模型,其中,所述目标关系分类模型用于对所述候选类型的文本进行实体关系分类。
2.根据权利要求1所述的实体关系分类方法,其特征在于,所述根据文本样本所属的类型,将目标类型的文本样本确定为源域数据,将除所述目标类型之外的候选类型的文本样本确定为候选域数据,包括:
获取多种类型的文本样本;
根据所述文本样本所属的类型对所述文本样本进行分类,得到多个样本类;
确定各所述样本类中已标注的文本样本的数量,以获得各所述样本类的标注率;
根据各所述样本类的标注率,从所述多个样本类中确定目标样本类,以将所述目标样本类确定为源域数据,将不属于所述目标样本类的文本样本确定为候选域数据。
3.根据权利要求2所述的实体关系分类方法,其特征在于,所述将所述源域数据作为训练数据获得第一关系分类模型,包括:
将所述源域数据中已标注的文本样本作为训练数据获得所述第一关系分类模型。
4.根据权利要求1所述的实体关系分类方法,其特征在于,所述将所述源域数据作为训练数据获取第一关系分类模型,包括:
从所述候选域数据中选取已标注的目标样本,将所述目标样本与所述源域数据作为训练数据,以获得训练后的所述第一关系分类模型。
5.根据权利要求3或4所述的实体关系分类方法,其特征在于,所述将所述目标样本与所述源域数据作为训练数据,以获得训练后的所述第一关系分类模型,包括:
获取所述训练数据中各所述文本样本的向量表示;
利用所述标注以及所述向量表示获取训练后的所述第一关系分类模型。
6.根据权利要求1所述的实体关系分类方法,其特征在于,所述根据所述实体关系分类的分类结果对所述第一关系分类模型再次进行训练,以获取目标关系分类模型,包括:
将所述分类结果中预测概率大于预设阈值的文本样本作为第一目标样本,并根据所述第一目标样本的预测概率确定所述第一目标样本的标签;
利用包含标签的所述第一目标样本对所述第一关系分类模型再次进行训练,以获得第二关系分类模型,将所述第二关系分类模型作为所述目标关系分类模型。
7.根据权利要求6所述的实体关系分类方法,其特征在于,获得第二关系分类模型之后,还包括:
将所述候选域数据中除所述第一目标样本之外的文本样本输入所述第二关系分类模型中,以获得所述第二关系分类模型输出的预测概率大于所述预设阈值的第二目标样本;
根据所述第二关系分类模型对所述第二目标样本的预测概率确定所述第二目标样本的标签,利用包含标签的所述第二目标样本对所述第二关系分类模型再次进行训练,以获取所述目标关系分类模型。
8.一种实体关系分类装置,其特征在于,包括:
源域确定模块,用于根据文本样本所属的类型,将目标类型的文本样本确定为源域数据,将除所述目标类型之外的候选类型的文本样本确定为候选域数据;
候选域分类模块,用于将所述源域数据作为训练数据获得第一关系分类模型,并利用所述第一关系分类模型对所述候选域数据进行实体关系分类;
模型确定模块,用于根据所述实体关系分类的分类结果对所述第一关系分类模型再次进行训练,以获取目标关系分类模型,其中,所述目标关系分类模型用于对所述候选类型的文本进行实体关系分类。
9.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的方法。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-7任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于医渡云(北京)技术有限公司,未经医渡云(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911304843.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种家用电器
- 下一篇:一种显示设备、端口控制方法及存储介质