[发明专利]关键词生成方法、装置、设备及存储介质有效
| 申请号: | 202110036768.4 | 申请日: | 2021-01-12 |
| 公开(公告)号: | CN112364136B | 公开(公告)日: | 2021-04-23 |
| 发明(设计)人: | 邹若奇 | 申请(专利权)人: | 平安国际智慧城市科技股份有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06N3/04 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强 |
| 地址: | 518000 广东省深圳市前海深港合*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 关键词 生成 方法 装置 设备 存储 介质 | ||
本申请提供了一种关键词生成方法,包括:获取目标文本对应的词向量矩阵;将目标文本对应的词向量矩阵输入至神经网络模型,得到目标文本中每个词对应的得分,得分包括拼音维度的得分、词性维度的得分以及单词维度的得分;根据目标文本中每个词对应的得分,确定目标文本的搜索关键词。本申请实施例基于注意力机制的Bi‑LSTM网络,提取目标文本更深层次、更丰富的特征信息,同时结合拼音、词性、单词三个维度的得分,进一步得到更多尺度的信息特征,进而提高了目标文本关键词生成的准确率。
技术领域
本申请涉及计算机技术领域,尤其涉及一种关键词生成方法、装置、设备及存储介质。
背景技术
随着互联网技术的快速发展,人们在生活、学习和工作中越来越依赖于互联网,例如通过互联网查找需要的视频或者文本资料。人们在查找资料时,只需在搜索引擎中输入需要查找的资料的关键词,即可得到需要的信息。但是,搜索引擎在根据用户输入的关键词进行查找时,主要是将用户输入的关键词与每个资料对应的关键词进行匹配,将匹配度高的资料呈现给用户。因此,搜索引擎查找到的资料与用户需要的资料的匹配程度依赖于资料对应的关键词,如果资料对应的关键词不能准确的表示该资料的主要内容,则搜索引擎的搜索到的资料不能很好的满足用户的需求。
发明内容
本申请提供了一种关键词生成方法、装置、设备及存储介质,能够提高目标文本关键词生成的准确率。
第一方面,本申请实施例提供了一种关键词生成方法,包括:获取目标文本对应的词向量矩阵;将目标文本对应的词向量矩阵输入至神经网络模型,得到目标文本中每个词对应的得分,得分包括拼音维度的得分、词性维度的得分以及单词维度的得分;根据目标文本中每个词对应的得分,确定目标文本的搜索关键词。
在一种可能的实现方式中,根据目标文本中每个词对应的得分,确定目标文本的搜索关键词,包括:对拼音维度的得分、词性维度的得分以及单词维度的得分进行加权求和,得到目标文本中的每个词对应的最终得分;将目标文本中的每个词根据最终得分从大到小进行排序,将排列在前的预设数量的词作为目标文本的搜索关键词。
在一种可能的实现方式中,获取目标文本对应的词向量矩阵之前,还包括:获取目标文本,对目标文本进行分词处理,得到目标文本对应的多个词;对目标文本对应的多个词采用词向量模型进行处理,得到目标文本对应的词向量矩阵。
在一种可能的实现方式中,获取目标文本对应的词向量矩阵之前,还包括:获取训练文本对应的词向量矩阵;将训练文本的词向量矩阵输入至基于注意力机制的双向长短期记忆人工神经网络模型,得到训练文本对应的文本表示矩阵;文本表示矩阵与拼音维度的实际得分训练第一线性回归模型,得到训练文本对应的拼音维度的预测得分,根据拼音维度的预测得分与拼音维度的实际得分,确定第一损失函数值;根据第一损失函数值更新第一线性回归模型的拼音维度的权重矩阵和第一线性回归模型的拼音维度的偏置矩阵,得到训练好的第一线性回归模型;文本表示矩阵与词性维度的实际得分训练第二线性回归模型,得到训练文本对应的词性维度的预测得分,根据词性维度的预测得分与词性维度的实际得分,确定第二损失函数值;根据第二损失函数值更新第二线性回归模型的词性维度的权重矩阵和第二线性回归模型的词性维度的偏置矩阵,得到训练好的第二线性回归模型;文本表示矩阵与单词维度的实际得分训练第三线性回归模型,得到训练文本对应的单词维度的预测得分,根据单词维度的预测得分与单词维度的实际得分,确定第三损失函数值;根据第三损失函数值更新第三线性回归模型的单词维度的权重矩阵和第三线性回归模型的单词维度的偏置矩阵,得到训练好的第三线性回归模型。
在一种可能的实现方式中,上述将目标文本对应的词向量矩阵输入至神经网络模型,得到目标文本中每个词对应的得分,包括:将目标文本对应的词向量矩阵输入至基于注意力机制的双向长短期记忆人工神经网络模型,得到目标文本对应的文本表示矩阵;根据训练好的第一线性回归模型中的拼音维度的权重矩阵、拼音维度的偏置矩阵以及文本表示矩阵,确定所述目标文本中每个词对应的拼音维度的得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安国际智慧城市科技股份有限公司,未经平安国际智慧城市科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110036768.4/2.html,转载请声明来源钻瓜专利网。





