[发明专利]关键词确定方法、装置、电子设备及存储介质有效
申请号: | 201910554221.6 | 申请日: | 2019-06-25 |
公开(公告)号: | CN110457672B | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 郑子欧;汪伟 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/216;G06F16/35 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键词 确定 方法 装置 电子设备 存储 介质 | ||
1.一种关键词确定方法,其特征在于,所述方法包括:
当接收到关键词提取指令时,获取事件文本;
采用ET-TAG模型引入背景词,以提取所述事件文本的子话题;
合并所述子话题,得到目标子话题;
对所述目标子话题进行特征学习,得到所述目标子话题的第一关键词,包括抽取所述目标子话题中的标签词语,采用Lasso分类模型对所述标签词语进行线性回归分析,以计算所述标签词语的评分,获取所述标签词语中评分大于或者等于预设值的词语,作为所述第一关键词;
通过关联度计算,从配置数据库中调取所述事件文本的关联词,所述配置数据库中存储着所有与事件相关的文本报道和评论性文章;
基于贡献值,从所述关联词中确定所述事件文本的第二关键词;
合并所述第一关键词及所述第二关键词,得到所述事件文本的目标关键词。
2.如权利要求1所述的关键词确定方法,其特征在于,所述采用ET-TAG模型引入背景词,提取所述事件文本的子话题包括:
基于所述ET-TAG模型,采用PLSA-BLM算法计算在所述事件文本中出现的概率大于预设概率的词作为所述背景词;
从所述事件文本中删除所述背景词,得到更新文本;
从所述更新文本中提取话题,作为所述事件文本的子话题。
3.如权利要求1所述的关键词确定方法,其特征在于,所述合并所述子话题,得到目标子话题包括:
采用KL散度算法计算所述子话题间的散度;
当所述子话题中有两个子话题间的散度小于配置阈值时,合并所述两个子话题;
将合并后的所述子话题确定为所述目标子话题。
4.如权利要求1所述的关键词确定方法,其特征在于,所述抽取所述目标子话题中的标签词语包括:
获取所述目标子话题中的所有词语;
采用PLSA-BLM算法,计算所述所有词语的词频;
根据所述所有词语的词频,对所述所有词语进行排序;
筛选出所述所有词语中处于预设位置的词语作为所述标签词语。
5.如权利要求1所述的关键词确定方法,其特征在于,所述通过关联度计算,从配置数据库中调取所述事件文本的关联词包括:
计算所述配置数据库中的所有词语与所述事件文本的关联度;
获取所述关联度大于或者等于配置关联度的词语作为与所述事件文本相关的词语;
对与所述事件文本相关的词语进行分词预处理,得到所述关联词。
6.如权利要求1所述的关键词确定方法,其特征在于,所述基于贡献值,从所述关联词中确定所述事件文本的第二关键词包括:
计算所述关联词对所述第一关键词的贡献值;
获取贡献值最高的关联词作为所述第二关键词。
7.一种关键词确定装置,其特征在于,所述装置包括:
获取单元,用于当接收到关键词提取指令时,获取事件文本;
提取单元,用于采用ET-TAG模型引入背景词,提取所述事件文本的子话题;
合并单元,用于合并所述子话题,得到目标子话题;
学习单元,用于对所述目标子话题进行特征学习,得到所述目标子话题的第一关键词,包括抽取所述目标子话题中的标签词语,采用Lasso分类模型对所述标签词语进行线性回归分析,以计算所述标签词语的评分,获取所述标签词语中评分大于或者等于预设值的词语,作为所述第一关键词;
调取单元,用于通过关联度计算从配置数据库中,调取与所述事件文本相关的知识库的关联词,所述配置数据库中存储着所有与事件相关的文本报道和评论性文章;
确定单元,用于基于贡献值,从所述关联词中确定所述事件文本的第二关键词;
所述合并单元,还用于合并所述第一关键词及所述第二关键词,得到所述事件文本的目标关键词。
8.一种电子设备,其特征在于,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现如权利要求1至6中任意一项所述的关键词确定方法。
9.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现如权利要求1至6中任意一项所述的关键词确定方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910554221.6/1.html,转载请声明来源钻瓜专利网。