[发明专利]一种对目标对象进行标签标注的方法、装置和存储介质有效
申请号: | 201911318624.7 | 申请日: | 2019-12-19 |
公开(公告)号: | CN113011182B | 公开(公告)日: | 2023-10-03 |
发明(设计)人: | 董东;樊富春;褚雷;李江;韩哲;杜菁菁;李邵男;任冠英 | 申请(专利权)人: | 北京多点在线科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/216;G06F16/33;G06Q30/02 |
代理公司: | 北京万思博知识产权代理有限公司 11694 | 代理人: | 刘冀 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 目标 对象 进行 标签 标注 方法 装置 存储 介质 | ||
1.一种对目标对象进行标签标注的方法,其特征在于,包括:
获取与所述目标对象关联的语料信息;
从所述语料信息中确定与所述目标对象对应的第一词语集合,其中所述第一词语集合包括与所述目标对象对应的多个高频词语,所述高频词语为通过已构建的词频统计模型得到的所述语料信息中大于第一预设统计次数的词语;
根据所述多个高频词语生成与所述目标对象对应的第一词组对集合,其中所述第一词组对集合包括根据所述多个高频词语生成的词组对;
根据所述第一词组对集合以及与多个目标对象关联的第二词组对集合,确定与所述目标对象对应的标签。
2.根据权利要求1所述的方法,其特征在于,还包括通过以下操作生成所述第二词组对集合:
生成分别与多个目标对象对应的多个词组对集合;
根据生成的多个词组对集合生成所述第二词组对集合。
3.根据权利要求1所述的方法,其特征在于,根据所述第一词组对集合以及与多个目标对象关联的第二词组对集合,确定与所述目标对象对应的标签,包括:
确定所述第一词组对集合与所述第二词组对集合中的相同的词组对;
根据所述相同的词组对中的所述高频词语确定与所述目标对象对应的标签。
4.根据权利要求3所述的方法,其特征在于,根据所述相同的词组对中的所述高频词语确定与所述目标对象对应的标签,包括:
将相同的所述词组对中的所述高频词语确定为候选标签,获取所述候选标签的统计次数;
将大于第二预设统计次数的所述候选标签确定为所述目标对象对应的标签。
5.根据权利要求1所述的方法,其特征在于,在获取与所述目标对象关联的语料信息之前,包括:
获取由多个目标对象关联的语料信息组成的语料信息库;
根据所述语料信息库通过TF/IDF算法训练得到所述词频统计模型。
6.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时由处理器执行权利要求1至5中任意一项所述的对目标对象进行标签标注的方法。
7.一种对目标对象进行标签标注的装置,其特征在于,包括:
语料信息获取模块,用于获取与所述目标对象关联的语料信息;
词语集合确定模块,用于从所述语料信息中确定与所述目标对象对应的第一词语集合,其中所述第一词语集合包括与所述目标对象对应的多个高频词语,所述高频词语为通过已构建的词频统计模型得到的所述语料信息中大于第一预设统计次数的词语;
词组对集合生成模块,用于根据所述多个高频词语生成与所述目标对象对应的第一词组对集合,其中所述第一词组对集合包括根据所述多个高频词语生成的词组对;
目标标签确认模块,用于根据所述第一词组对集合以及与多个目标对象关联的第二词组对集合,确定与所述目标对象对应的标签。
8.根据权利要求7所述的装置,其特征在于,还包括通过以下操作生成所述第二词组对集合:
生成分别与多个目标对象对应的多个词组对集合;
根据生成的多个词组对集合生成所述第二词组对集合。
9.根据权利要求7所述的装置,其特征在于,所述目标标签确认模块具体用于:
确定所述第一词组对集合与所述第二词组对集合中的相同的词组对;
根据所述相同的词组对中的所述高频词语确定与所述目标对象对应的标签。
10.一种对目标对象进行标签标注的装置,其特征在于,包括:
处理器;以及
存储器,与所述处理器连接,用于为所述处理器提供处理以下处理步骤的指令:
获取与所述目标对象关联的语料信息;
从所述语料信息中确定与所述目标对象对应的第一词语集合,其中所述第一词语集合包括与所述目标对象对应的多个高频词语,所述高频词语为通过已构建的词频统计模型得到的所述语料信息中大于第一预设统计次数的词语;
根据所述多个高频词语生成与所述目标对象对应的第一词组对集合,其中所述第一词组对集合包括根据所述多个高频词语生成的词组对;
根据所述第一词组对集合以及与多个目标对象关联的第二词组对集合,确定与所述目标对象对应的标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京多点在线科技有限公司,未经北京多点在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911318624.7/1.html,转载请声明来源钻瓜专利网。