[发明专利]用于输出信息的方法和装置有效
| 申请号: | 201910243599.4 | 申请日: | 2019-03-28 |
| 公开(公告)号: | CN111753080B | 公开(公告)日: | 2023-08-22 |
| 发明(设计)人: | 卜建辉;黄强;谢炜坚;吴伟佳 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36 |
| 代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 输出 信息 方法 装置 | ||
本申请实施例公开了用于输出信息的方法和装置。上述方法的一具体实施方式包括:获取目标句子;对目标句子进行分类,以及确定与分类结果对应的、预先建立的语义表达模型,其中,语义表达模型用于表征句子与向量的对应关系;根据所确定的语义表达模型,确定目标句子的向量;基于所确定的向量,输出与目标句子相关的信息。该实施方式提高了句子的语义表达的准确度。
技术领域
本申请实施例涉及计算机技术领域,具体涉及用于输出信息的方法和装置。
背景技术
文本的语义表达是指将自然语言形式的文本,编码成一个特定的向量,使得这个向量包含该文本的语义信息。一个好的语义表达结果将有助于提升文本相似性检索、情感分类、领域分类等各类任务的效果和性能。
发明内容
本申请实施例提出了用于输出信息的方法和装置。
第一方面,本申请实施例提供了一种用于输出信息的方法,包括:获取目标句子;对上述目标句子进行分类,以及确定与分类结果对应的、预先建立的语义表达模型,其中,上述语义表达模型用于表征句子与向量的对应关系;根据所确定的语义表达模型,确定上述目标句子的向量;基于所确定的向量,输出与上述目标句子相关的信息。
在一些实施例中,目标句子为用户通过搜索引擎输入的句子;以及上述方法还包括:响应于检测到用户在搜索引擎根据上述目标句子返回的搜索结果页面的点击操作,获取上述点击操作对应的页面的标题;确定上述标题的向量;将上述目标句子以及上述标题的向量关联存储在第一数据集合中;响应于确定上述第一数据集合满足预设条件,将上述第一数据集合中的句子作为输入,将与所输入的句子关联的向量作为期望输出,训练所确定的语义表达模型,得到目标语义表达模型。
在一些实施例中,上述方法还包括:获取第二数据集合,其中,上述第二数据集合包括句子以及与句子对应的向量;对上述第二数据集合中的句子进行分类,得到至少一个数据子集合;根据上述至少一个数据子集合,确定与上述至少一个数据子集合对应的语义表达模型。
在一些实施例中,上述根据上述至少一个数据子集合,确定与上述至少一个数据子集合对应的语义表达模型,包括:对于上述至少一个数据子集合中的数据子集合,将该数据子集合中的句子作为输入,将该数据子集合中与所输入的句子对应的向量作为期望输出,训练得到与该数据子集合对应的语义表达模型。
在一些实施例中,上述根据上述至少一个数据子集合,确定与上述至少一个数据子集合对应的语义表达模型,包括:对于上述至少一个数据子集合中的数据子集合,从该数据子集合中选取至少一个句子作为训练句子;将从其它数据子集合中选取出来的训练句子以及训练句子对应的向量加入该数据子集合,得到更新的数据子集合;将更新的数据子集合中的句子作为输入,将与所输入的句子对应的向量作为期望输出,训练得到与更新的数据子集合对应的语义表达模型。
第二方面,本申请实施例提供了一种用于输出信息的装置,包括:句子获取单元,被配置成获取目标句子;模型确定单元,被配置成对上述目标句子进行分类,以及确定与分类结果对应的、预先建立的语义表达模型,其中,上述语义表达模型用于表征句子与向量的对应关系;第一向量确定单元,被配置成根据所确定的语义表达模型,确定上述目标句子的向量;信息输出单元,被配置成基于所确定的向量,输出与上述目标句子相关的信息。
在一些实施例中,目标句子为用户通过搜索引擎输入的句子;以及上述装置还包括:标题获取单元,被配置成响应于检测到用户在搜索引擎根据上述目标句子返回的搜索结果页面的点击操作,获取上述点击操作对应的页面的标题;第二向量确定单元,被配置成确定上述标题的向量;数据存储单元,被配置成将上述目标句子以及上述标题的向量关联存储在第一数据集合中;第一模型训练单元,被配置成响应于确定上述第一数据集合满足预设条件,将上述第一数据集合中的句子作为输入,将与所输入的句子关联的向量作为期望输出,训练所确定的语义表达模型,得到目标语义表达模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910243599.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:控制方法、控制系统以及电动泵
- 下一篇:一种基于带宽部分的终端节能方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





