[发明专利]基于神经网络的搜索方法、设备及存储介质有效
| 申请号: | 201810278074.X | 申请日: | 2018-03-30 |
| 公开(公告)号: | CN108536791B | 公开(公告)日: | 2019-07-30 |
| 发明(设计)人: | 刘凯;吕雅娟;吴甜 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06N3/04 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 于江微;刘芳 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文档 内容校验 神经网络 搜索结果 搜索 存储介质 开始位置 目标搜索 搜索对象 参考 校验 概率 向量 匹配 | ||
1.一种基于神经网络的搜索方法,其特征在于,包括:
获取搜索对象及与所述搜索对象匹配的多个文档;
根据每个所述文档对应的第一神经网络向量,确定每个所述文档的内容校验值,所述第一神经网络向量中的元素用于表征所述文档中的单元与所述搜索对象中的单元的相关性,所述内容校验值用于表示每个所述文档作为搜索结果时其他文档对所述文档的支持程度;
根据每个所述文档的内容校验值、搜索结果的开始位置和结束位置、所述开始位置对应的概率值和所述结束位置对应的概率值,确定每个所述文档中各片段对应的参考值,搜索结果的开始位置和结束位置,是指文档中与搜索对象相关的所有可能答案的开始位置和结束位置,每一开始位置及其对应的结束位置确定一片段,所述参考值用于表示片段作为搜索结果的可能性;
根据多个所述文档中各片段对应的参考值,确定最大参考值对应的片段为目标搜索结果。
2.根据权利要求1所述的基于神经网络的搜索方法,其特征在于,所述根据每个所述文档对应的第一神经网络向量,确定每个所述文档的内容校验值,包括:
根据每个所述文档对应的第一神经网络向量,确定所述文档中各单元作为搜索结果的概率;
根据每个所述文档对应的第二神经网络向量、所述文档中各单元作为搜索结果的概率与其他文档中各单元作为搜索结果的概率,确定每个所述文档的内容校验值,所述第二神经网络向量中的元素用于表征所述文档中的单元。
3.根据权利要求2所述的基于神经网络的搜索方法,其特征在于,所述根据每个所述文档对应的第一神经网络向量,确定所述文档中各单元作为搜索结果的概率,包括:
将第i个文档中第k个单元在对应第一神经网络向量中的元素值与一神经网络参数作为任一第一函数的自变量,得到所述第一函数输出的第一值,所述第一函数包括输出为第一预设范围的神经元函数;
将所述第一值和另一神经网络参数作为任一输出为第二预设范围的第二函数的自变量,得到所述第二函数输出的第二值,作为第i文档中第k个单元作为搜索结果的概率;
其中,i取值为1~N中任一整数值,N为所述多个文档的个数;k取值为1~M中任一整数值,M为第i个文档中的单元个数,不同文档对应的M值相同或不同。
4.根据权利要求2所述的基于神经网络的搜索方法,其特征在于,所述根据每个所述文档对应的第二神经网络向量、所述文档中各单元作为搜索结果的概率与其他文档中各单元作为搜索结果的概率,确定每个所述文档的内容校验值,包括:
根据每个所述文档对应的第二神经网络向量和所述文档中各单元作为搜索结果的概率,得到每个所述文档作为搜索结果的第三神经网络向量;
根据所有所述文档作为搜索结果的第三神经网络向量,得到每个所述文档的内容校验值。
5.根据权利要求4所述的基于神经网络的搜索方法,其特征在于,所述根据每个所述文档对应的第二神经网络向量和所述文档中各单元作为搜索结果的概率,得到每个所述文档作为搜索结果的第三神经网络向量,包括:
将第i个文档中第k个单元在第i个文档对应的第二神经网络向量中的元素值与第i文档中第k个单元作为搜索结果的概率相乘,得到第一结果,其中,所述元素值为一维向量,k取值为1~M中任一整数值,M为第i个文档中的单元个数,不同文档对应的M值可以相同或不同,i取值为1~N中任一整数值,N为所述多个文档的个数;
累加第i个文档中每个单元对应的第一结果,并将累加得到的结果除以M,得到第i个文档作为搜索结果的第三神经网络向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810278074.X/1.html,转载请声明来源钻瓜专利网。





