[发明专利]标签结构的扩展方法、装置及电子设备有效
申请号: | 201711339251.2 | 申请日: | 2017-12-14 |
公开(公告)号: | CN110019983B | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 方瑞玉 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F40/279 |
代理公司: | 北京曼威知识产权代理有限公司 11709 | 代理人: | 方志炜 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 结构 扩展 方法 装置 电子设备 | ||
1.一种标签结构的扩展方法,其特征在于,包括:
获取待扩展标签结构,所述待扩展标签结构包含待扩展节点和待扩展节点的已有子节点;
基于所述待扩展标签结构,从第一数据库中获取正训练样本和负训练样本;
使用所述正训练样本和所述负训练样本训练关系识别模型;
使用第二数据库中的任一标签替换所述待扩展标签结构中的已有子节点,得到待识别节点关系;
基于所述关系识别模型对所述待识别节点关系进行识别,将识别结果为正例的待识别节点关系中的子节点确定为用于扩展已有标签结构的扩展子节点;
所述基于所述待扩展标签结构,从第一数据库中获取正训练样本,包括:
从第一数据库中查找与所述待扩展标签结构完全一致的匹配标签结构;
将每一个匹配标签结构中父节点的描述文本和子节点的描述文本确定为对应的一个正训练样本;
所述基于所述待扩展标签结构,从第一数据库中获取负训练样本,包括:
从第一数据库中查找与所述待扩展标签结构不完全一致的非匹配标签结构;
将每一个非匹配标签结构中父节点的描述文本和子节点的描述文本确定为对应的一个负训练样本。
2.根据权利要求1所述的方法,其特征在于,所述使用所述正训练样本和所述负训练样本训练关系识别模型,包括:
计算所有正训练样本中父节点的描述文本和子节点的描述文本对应的第一组特征及特征值,以及所有负训练样本中父节点的描述文本和子节点描述文本的第二组特征及特征值;
将所述第一组特征及特征值和所述第二组特征及特征值输入神经网络,得到所述关系识别模型。
3.根据权利要求2所述的方法,其特征在于,所述计算所有正训练样本中父节点的描述文本和子节点描述文本对应的第一组特征及特征值,包括:
将所有正训练样本中每一个正训练样本的父节点的描述文本和子节点的描述文本分别进行分词处理;
计算所述父节点的描述文本分词得到的分词向量,和子节点的描述文本分词得到的分词向量的向量距离,得到第一组特征及特征值;
所述计算所有负训练样本中父节点的描述文本和子节点描述文本的第二组特征及特征值,包括:
将所有负训练样本中每一个负训练样本的父节点的描述文本和子节点的描述文本分别进行分词处理;
计算所述父节点的描述文本分词得到的分词向量,和子节点的描述文本分词得到的分词向量的向量距离,得到第二组特征及特征值。
4.根据权利要求2所述的方法,其特征在于,所述计算所有正训练样本中父节点的描述文本和子节点描述文本对应的第一组特征及特征值,包括:
针对每一个正训练样本,使用卷积神经网络提取所述父节点的描述文本的父文本特征,以及所述子节点的描述文本的子文本特征;
计算所述父文本特征和所述子文本特征的向量距离,得到所述第一组特征及特征值;
所述计算所有负训练样本中父节点的描述文本和子节点描述文本的第二组特征及特征值,包括:
针对每一个负训练样本,使用卷积神经网络提取所述父节点的描述文本的父文本特征,以及所述子节点的描述文本的子文本特征;
计算所述父文本特征和所述子文本特征的向量距离,得到所述第二组特征及特征值。
5.根据权利要求1所述的方法,其特征在于,所述使用第二数据库中的任一标签替换所述待扩展标签结构中的已有子节点,得到待识别节点关系,包括:
在所述第二数据库中提取与所述待扩展标签结构中的待扩展节点匹配的标签作为候选标签;
使用所述候选标签中的任一标签替换所述待扩展标签结构中的已有子节点,得到所述待识别节点关系。
6.根据权利要求5所述的方法,其特征在于,所述在所述第二数据库中提取与所述待扩展标签结构中的待扩展节点匹配的标签作为候选标签,包括:
将所述待扩展节点进行分词处理,得到参考分词;
计算所述参考分词与所述第二数据库中的每一个标签对应的分词的文本匹配度;
将文本匹配度大于设定匹配度的标签确定为候选标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711339251.2/1.html,转载请声明来源钻瓜专利网。