[发明专利]训练实体类型识别模型的方法、实体类型识别方法及装置在审
申请号: | 202211563437.7 | 申请日: | 2022-12-07 |
公开(公告)号: | CN116304014A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 丁宁;王潇斌;徐光伟;谢朋峻;郑海涛 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/279;G06F40/216;G06F40/237;G06F40/30;G06N5/022;G06N3/0455 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 袁媛 |
地址: | 311121 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 实体 类型 识别 模型 方法 装置 | ||
1.一种训练实体类型识别模型的方法,其特征在于,所述方法包括:
获取包括多个训练样本的训练数据,所述训练样本包括文本样本以及所述文本样本中实体词被标注的实体类型标签;
利用所述训练数据训练实体类型识别模型,所述实体类型识别模型包括预测网络和基于预训练语言模型的编码网络;所述训练包括:
利用文本样本中的实体词生成提示文本,所述提示文本包含所述文本样本中的实体词以及被掩码内容;利用文本样本以及提示文本得到输入文本序列,将所述文本输入序列输入所述编码网络,由所述编码网络提取所述输入文本序列中各元素的特征表示;所述预测网络利用所述各元素的特征表示,预测所述提示文本中被掩码的内容在词表中各词语上的概率分布,依据所述概率分布得到所述文本样本中的实体词对应的实体类型,所述词表包括各实体类型对应的标签词;所述训练目标包括:最小化所述编码网络得到的所述文本样本中的实体词对应的实体类型与所述文本样本中的实体词被标注的实体类型标签之间的差异。
2.根据权利要求1所述的方法,其特征在于,所述利用文本样本中的实体词生成提示文本包括:
将所述文本样本中的实体词填入预设的提示模板中的对应槽位,得到提示文本,所述提示模板包含实体词对应的槽位以及被掩码的内容标识。
3.根据权利要求2所述的方法,其特征在于,所述预设的提示模板还包括体现所述实体词对应的槽位以及被掩码的内容标识之间语义关系的上下文;或者,
所述预设的提示模板还包括所述实体词对应的槽位以及被掩码的内容标识的参数化的上下文,所述参数化的上下文在所述实体类型识别模型的训练过程中被更新。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述词表还包括各实体类型对应的标签词的同义词;
依据所述概率分布得到所述文本样本中的实体词对应的实体类型包括:
针对各实体类型,分别确定所述提示文本中被掩码的内容在所述词表中各实体类型对应各词语上的概率统计值,将对应概率统计值最大的实体类型确定为所述文本样本中的实体词对应的实体类型。
5.一种实体类型识别的方法,其特征在于,所述方法包括:
获取待识别文本;
利用所述待识别文本中的实体词生成提示文本,所述提示文本包含所述待识别文本中的实体词以及被掩码内容;
利用所述待识别文本和所述提示文本得到输入文本序列,将所述输入文本序列输入实体类型识别模型,获取所述实体类型识别模型针对所述待识别文本中实体词预测的实体类型,所述实体类型识别模型包括预测网络和基于预训练语言模型的编码网络;
其中,所述编码网络提取所述输入文本序列中各元素的特征表示;所述预测网络利用所述各元素的特征表示,预测所述提示文本中被掩码的内容在词表中各词语上的概率分布,依据所述概率分布得到所述待识别文本中的实体词对应的实体类型,所述词表包括各实体类型对应的标签词。
6.根据权利要求5所述的方法,其特征在于,利用所述待识别文本中的实体词生成提示文本包括:
将所述待识别文本中的实体词填入预设的提示模板中的对应槽位,得到提示文本,所述预设模板包含实体词对应的槽位以及被掩码的内容标识。
7.根据权利要求5所述的方法,其特征在于,所述词表还包括各实体类型对应的标签词的同义词;
依据所述概率分布得到所述待识别文本中的实体词对应的实体类型包括:
针对各实体类型,分别确定所述提示文本中被掩码的内容在所述词表中各实体类型对应词语上的概率统计值,将对应概率统计值最大的实体类型确定为所述待识别文本中的实体词对应的实体类型。
8.根据权利要求5至7中任一项所述的方法,其特征在于,将预设文本集中的各文本分别作为所述待识别文本,利用所述待识别文本中的实体词及其对应的实体类型构建知识图谱;或者,
将用户在智能客服系统输入的文本作为所述待识别文本,利用所述待识别文本中的实体词及其对应的实体类型,在该实体类型对应的知识库中匹配实体词对应的属性信息或服务项目,用以返回给所述用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211563437.7/1.html,转载请声明来源钻瓜专利网。