[发明专利]一种生成问答的方法、装置、设备和计算存储介质有效
| 申请号: | 201810120655.0 | 申请日: | 2018-02-07 |
| 公开(公告)号: | CN108491421B | 公开(公告)日: | 2021-04-16 |
| 发明(设计)人: | 黄际洲;孙雅铭 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06N3/04;G06N3/08 |
| 代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 生成 问答 方法 装置 设备 计算 存储 介质 | ||
本发明提供了一种生成问答的方法、装置、设备和计算机存储介质,其中方法包括:利用预先训练得到的问题生成模型,针对输入的图像生成问题;对所述问题进行实体和属性识别,得到所述问题的实体和属性;利用知识图谱查询所述实体的所述属性的值,作为所述问题的答案。本发明能够基于图像自动生成问答,从而方便用户获取知识,提高趣味性。
【技术领域】
本发明涉及计算机应用技术领域,特别涉及一种生成问答的方法、装置、设备和计算机存储介质。
【背景技术】
图像通常包含丰富的语义信息和知识信息,用户在了解一些信息的同时往往需要配合图像作为更直观的辅助。在现有的图像搜索技术中,用户在图像的搜索结果页中能够获取图像的描述文档。但用户仍需要浏览大量图文来获取知识,一方面需要耗费较多的时间和精力,另一方面阅读冗长文档的趣味性也较差。
【发明内容】
有鉴于此,本发明提供了一种生成问答的方法、装置、设备和计算机存储介质,能够基于图像自动生成问答,从而方便用户获取知识,提高趣味性。
具体技术方案如下:
本发明提供了一种生成问答的方法,该方法包括:
利用预先训练得到的问题生成模型,针对输入的图像生成问题;
对所述问题进行实体和属性识别,得到所述问题的实体和属性;
利用知识图谱查询所述实体的所述属性的值,作为所述问题的答案。
根据本发明一具体实施方式,所述问题生成模型采用如下方式训练得到:
获取训练数据,所述训练数据包括问题型query以及该问题型query对应的被点击搜索结果包含的图像;
将训练数据中的图像作为输入、对应的问题型query作为输出,训练包含CNN和RNN的神经网络模型,得到问题生成模型。
根据本发明一具体实施方式,所述获取训练数据包括:
从搜索日志中获取搜索次数大于或等于预设搜索次数阈值,或获取搜索频率大于或等于预设搜索频率阈值的问题型query。
根据本发明一具体实施方式,所述获取训练数据包括:
从搜索日志中获取问题型query对应的被点击搜索结果包含的图像中,被点击次数超过预设次数阈值的图像,作为训练数据中所述问题型query对应的图像。
根据本发明一具体实施方式,所述问题生成模型中,所述CNN用于将输入的图像映射至语义空间,得到图像的语义向量;
所述RNN用于基于图像的语义向量预测词序列,得到图像的问题。
根据本发明一具体实施方式,对所述问题进行实体和属性识别,得到所述问题的实体和属性包括:
对所述问题进行实体和属性识别;
将所述识别出的实体和属性映射至知识图谱中的表达,得到所述问题的实体和属性。
根据本发明一具体实施方式,将所述识别出的实体和属性映射至知识图谱中的表达包括:
从所述知识图谱中抽取出所述识别出的实体对应的候选实体,以及识别出的属性对应的候选属性;
利用预先建立的排序模型,对所述候选实体和候选属性分别进行排序;
将排在首位的候选实体和候选属性分别确定为映射至知识图谱中的实体和属性。
根据本发明一具体实施方式,该方法还包括:
查询问答类搜索日志,获取所述问题对应的被点击搜索结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810120655.0/2.html,转载请声明来源钻瓜专利网。





