[发明专利]关键词生成方法、装置、电子设备和计算机可读介质有效
| 申请号: | 202011354276.1 | 申请日: | 2020-11-27 |
| 公开(公告)号: | CN112464654B | 公开(公告)日: | 2022-06-17 |
| 发明(设计)人: | 石聪;邵德奇;关培培;赵喆;田兴亚;段治平;冯超;李腾飞 | 申请(专利权)人: | 科技日报社 |
| 主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/289;G06N3/04;G06N3/08 |
| 代理公司: | 北京嘉科知识产权代理事务所(特殊普通合伙) 11687 | 代理人: | 杨波 |
| 地址: | 100089*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 关键词 生成 方法 装置 电子设备 计算机 可读 介质 | ||
1.一种关键词生成方法,包括:
对目标文本进行分词处理,得到词语集合;
生成所述词语集合中每个词语的词向量,得到词向量集合;
基于所述词向量集合,生成文本向量;
基于所述词语集合、所述词向量集合和所述文本向量,生成关键词;
所述对目标文本进行分词处理,得到词语集合,包括:基于预设词表,对所述目标文本进行分词处理,得到词语集合,所述预设词表基于行业类别预先构建;
所述生成所述词语集合中每个词语的词向量,得到词向量集合,包括:将所述词语集合中每个词语输入至预先训练的深度学习网络,得到每个词语的词向量,组成词向量集合,所述深度学习网络为BERT中文模型;
所述基于所述词向量集合,生成文本向量,包括:将所述词向量集合输入至所述深度学习网络,生成所述文本向量;
所述基于所述词语集合、所述词向量集合和所述文本向量,生成关键词,包括:确定所述词语集合中每个词语的词性,得到词性集合,词性包括名词、动词、形容词、行业词;基于所述词性集合和预设权重,为所述词语集合中的每个词语添加词性权重,得到词性权重集合;确定所述词向量集合中每个词向量与所述文本向量的余弦值,得到余弦值集合,所述余弦值通过确定词向量与文本向量的余弦夹角得到;
基于所述余弦值集合,为所述词语集合中的每个词语添加语义权重,得到语义权重集合;基于所述词性权重集合和所述语义权重集合,生成关键词;
所述基于所述词语集合、所述词向量集合和所述文本向量,生成关键词,包括:基于所述词性权重集合和所述语义权重集合,确定所述词语集合中每个词语的总权重,得到总权重集合,其中,所述总权重为词语的词性权重和语义权重之和;基于所述总权重集合,对所述词语集合中的词语按照总权重由大到小的顺序进行排序,得到词语序列;从所述词语序列中选择词语,以及将所述词语确定为关键词。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述关键词推送至具有显示功能的目标设备,以及控制所述目标设备显示所述关键词。
3.一种关键词生成装置,包括:
分词单元,被配置成对目标文本进行分词处理,得到词语集合;
第一生成单元,被配置成生成所述词语集合中每个词语的词向量,得到词向量集合;
第二生成单元,被配置成基于所述词向量集合,生成文本向量;
第三生成单元,被配置成基于所述词语集合、所述词向量集合和所述文本向量,生成关键词;
所述对目标文本进行分词处理,得到词语集合,包括:基于预设词表,对所述目标文本进行分词处理,得到词语集合,所述预设词表基于行业类别预先构建;
所述生成所述词语集合中每个词语的词向量,得到词向量集合,包括:将所述词语集合中每个词语输入至预先训练的深度学习网络,得到每个词语的词向量,组成词向量集合,所述深度学习网络为BERT中文模型;
所述基于所述词向量集合,生成文本向量,包括:将所述词向量集合输入至所述深度学习网络,生成所述文本向量;
所述基于所述词语集合、所述词向量集合和所述文本向量,生成关键词,包括:确定所述词语集合中每个词语的词性,得到词性集合,词性包括名词、动词、形容词、行业词;基于所述词性集合和预设权重,为所述词语集合中的每个词语添加词性权重,得到词性权重集合;确定所述词向量集合中每个词向量与所述文本向量的余弦值,得到余弦值集合,所述余弦值通过确定词向量与文本向量的余弦夹角得到;
基于所述余弦值集合,为所述词语集合中的每个词语添加语义权重,得到语义权重集合;基于所述词性权重集合和所述语义权重集合,生成关键词;
所述基于所述词语集合、所述词向量集合和所述文本向量,生成关键词,包括:基于所述词性权重集合和所述语义权重集合,确定所述词语集合中每个词语的总权重,得到总权重集合,其中,所述总权重为词语的词性权重和语义权重之和;基于所述总权重集合,对所述词语集合中的词语按照总权重由大到小的顺序进行排序,得到词语序列;从所述词语序列中选择词语,以及将所述词语确定为关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科技日报社,未经科技日报社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011354276.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种方便调节流量的密封阀门
- 下一篇:一种自动打泡装置及其使用方法





