[发明专利]基于深度问答的提问型搜索词搜索方法及装置在审
| 申请号: | 201611222771.0 | 申请日: | 2016-12-27 |
| 公开(公告)号: | CN106649760A | 公开(公告)日: | 2017-05-10 |
| 发明(设计)人: | 赵惜墨 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 问答 提问 搜索词 搜索 方法 装置 | ||
1.一种基于深度问答的提问型搜索词的搜索方法,其特征在于,包括以下步骤:
对搜索词进行识别,确定所述搜索词为提问型的搜索词;
从数据库中查询与所述搜索词匹配的页面信息;
根据各特征,对所述页面信息进行多特征分析,得到各特征的特征分值;其中,所述特征用于评价页面信息回答所述搜索词所提问题的有效性;
根据各特征的特征分值,对所述页面信息进行排序;
依据所述排序,对所述页面信息进行展示。
2.根据权利要求1所述的提问型搜索词的搜索方法,其特征在于,所述数据库为离线数据库,所述数据库中所记载的页面信息包括:
对页面进行实体抽取得到的实体数据;
和/或,对页面中包含答案的段落进行抽取得到的分段数据;
和/或,从问答型页面中对包含问题的段落,以及包含答案的段落以预设结构化方式进行组织所得到的结构化数据。
3.根据权利要求1所述的提问型搜索词的搜索方法,其特征在于,所述特征包括深度卷积神经网络特征,所述对所述页面信息进行多特征分析,得到各特征的特征分值,包括:
根据所述页面信息中的单词,以及所述搜索词,利用深度卷积神经网络进行问题答案对的匹配,以确定出所述页面信息的第一特征分值;所述深度卷积神经网络已预先对问题和答案之间的匹配程度进行学习。
4.根据权利要求1所述的提问型搜索词的搜索方法,其特征在于,所述特征包括数字特征,所述对所述页面信息进行多特征分析,得到各特征的特征分值,包括:
当所述搜索词所提问题的答案为数字形式时,依据度量单位抽取各个页面信息中的数字答案;
若所述搜索词所需查询的数字答案为约数,则对抽取出的数字答案进行单遍聚类,得到每一个聚簇的分值;若所述搜索词所需查询的数字答案为确定的数值,则对抽取出的数据答案进行字面值聚类,得到每一个聚簇的分值;
将所述聚簇的分值作为包含所述聚簇中数字答案的页面信息的第二特征分值。
5.根据权利要求1所述的提问型搜索词的搜索方法,其特征在于,所述特征包括聚合特征,所述对所述页面信息进行多特征分析,得到各特征的特征分值,包括:
利用统计单词出现频次的算法,对页面信息所包含的各单词进行打分,得到用于指示各单词出现频次的分值;
根据用于指示各单词出现频次的分值,确定包含所述单词的页面信息的第三特征分值。
6.根据权利要求1所述的提问型搜索词的搜索方法,其特征在于,所述特征包括实体特征,所述对所述页面信息进行多特征分析,得到各特征的特征分值,包括:
根据所述搜索词所提问题,估计所述用户的查询意图;
依据所述页面信息中的实体数据,对所述页面信息的各实体进行聚类,得到用于指示各实体数据能够满足所述查询意图的程度的第四特征分值。
7.根据权利要求1所述的提问型搜索词的搜索方法,其特征在于,所述特征包括对齐特征,所述对所述页面信息进行多特征分析,得到各特征的特征分值,包括:
利用对齐模型,将所述搜索词与页面信息中的段落进行对齐,得到包含所述段落的页面信息的第五特征分值;其中,所述对齐模型已预先对问题和答案中单词的词对齐情况进行学习。
8.根据权利要求1所述的提问型搜索词的搜索方法,其特征在于,所述特征包括长度特征,所述对所述页面信息进行多特征分析,得到各特征的特征分值,包括:
对所述页面信息的长度特征进行分析,得到用于指示页面信息所包含内容的丰富程度的第六特征分值。
9.根据权利要求1所述的提问型搜索词的搜索方法,其特征在于,所述特征包括位置特征,所述对所述页面信息进行多特征分析,得到各特征的特征分值,包括:
对所述页面信息的位置特征进行分析,得到用于指示页面信息在搜索词匹配的全部页面信息中的排序情况的第七特征分值;所述排序依据所述搜索词与页面信息的匹配程度。
10.根据权利要求1-9任一项所述的提问型搜索词的搜索方法,其特征在于,所述对搜索词进行识别,确定所述搜索词为提问型的搜索词,包括:
根据所述搜索词中所包含的疑问词,和/或所述搜索词中的问答型结尾词,和/或所述搜索词的匹配的页面中属于问答型页面的比例,识别所述搜索词是否为提问型的搜索词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611222771.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:图片的处理方法及移动终端
- 下一篇:基于深度问答的搜索结果展现方法和装置





