[发明专利]关键词生成方法、装置、设备及存储介质在审
申请号: | 202011505008.5 | 申请日: | 2020-12-18 |
公开(公告)号: | CN112528655A | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 姚开春;秦川;祝恒书;马超;张敬帅 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 钭飒飒;刘芳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键词 生成 方法 装置 设备 存储 介质 | ||
1.一种关键词生成方法,所述方法包括:
将目标文本输入文本处理模型,获取目标文本对应的单词序列,并生成所述单词序列对应的语义表征序列;
分别对所述语义表征序列中的每个语义表征向量进行预测,得到预测结果;
若预测结果指示所述语义表征向量对应的单词能够触发生成关键词,则根据所述语义表征向量、所述预测结果输出所述关键词。
2.根据权利要求1所述的方法,所述获取目标文本对应的单词序列,并生成所述单词序列对应的语义表征序列,包括:
对所述目标文本进行分词处理,得到所述目标文本对应的单词序列;
确定所述单词序列对应词向量序列;
采用双向长短期记忆编码器对所述词向量序列进行编码,获得对应的语义表征序列。
3.根据权利要求2所述的方法,所述分别对所述语义表征序列中的每个语义表征向量进行预测,得到预测结果,包括:
所述文本处理模型中的关键词指示器依次扫描所述语义表征序列中的每个语义表征向量;
根据所述关键词指示器上一个时刻的状态、所述关键词指示器上一个时刻的预测结果的嵌入式向量以及所述语义表征向量确定所述关键词指示器当前时刻的状态;
根据所述关键词指示器当前时刻的状态,确定所述语义表征向量触发技能短语的概率,并根据所述概率确定所述关键词指示器的预测结果,所述预测结果包括所述语义表征向量不能触发生成技能短语、所述语义表征向量能够触发生成由连续单词构成的技能短语,或者所述语义表征向量能够触发生成由非连续单词构成的技能短语。
4.根据权利要求3所述的方法,所述根据所述语义表征向量、所述预测结果输出所述关键词,包括:
解码器根据所述语义表征向量、所述关键词指示器的预测结果的嵌入式向量和所述关键词指示器的状态确定所述解码器的初始隐状态;
基于所述初始隐状态逐步确定每个解码步的隐状态,并对每个解码步的隐状态进行解码生成所述关键词。
5.根据权利要求4所述的方法,所述基于所述初始隐状态逐步确定每个解码步的隐状态,包括:
对于第一个解码步,根据所述初始隐状态、所述关键词指示器的预测结果的嵌入式向量以及默认初始字符的嵌入式向量,确定第一个解码步的隐状态;
对于第一个解码步之后的每个解码步,根据所述解码器上一个解码步的隐状态、所述关键词指示器的预测结果的嵌入式向量以及上一个解码步的解码结果的嵌入式向量,确定所述每个解码步的隐状态。
6.根据权利要求4所述的方法,所述对每个解码步的隐状态进行解码生成所述关键词,包括:
确定所述语义表征向量对所述每个解码步的隐状态的相关度,并根据所述相关度确定所述每个解码步的注意力分布;
根据所述每个解码步的注意力分布和所述语义表征序列确定所述每个解码步的隐状态的语义向量;
根据所述每个解码步的隐状态和所述每个解码步的隐状态的语义向量,确定所述每个解码步的单词初始概率;
根据所述初始概率和所述注意力分布确定所述每个解码步的单词概率;
根据所述单词概率确定所述每个解码步的解码结果。
7.根据权利要求4-6中任一项所述的方法,所述方法还包括:
根据所述关键词指示器的预测结果和所述解码器生成的关键词,确定所述关键词指示器的奖励值和所述解码器的奖励值,所述关键词指示器的奖励值用于表示所述关键词指示器的预测结果的准确度,所述解码器的奖励值用于表示所述解码器生成的关键词的准确度;
调整所述编码器、所述关键词指示器和所述解码器中的参数,以使所述关键词指示器的奖励值的期望值和所述解码器的奖励值的期望值达到最大值。
8.根据权利要求7所述的方法,所述关键词指示器的奖励值和所述解码器的奖励值均包括了每触发一个关键词对应的奖励值以及所有关键词对应的奖励值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011505008.5/1.html,转载请声明来源钻瓜专利网。