[发明专利]基于人工智能的搜索结果播报方法和装置有效
申请号: | 201610116708.2 | 申请日: | 2016-03-01 |
公开(公告)号: | CN105653738B | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 刘凯;冯洋;杨钦;吕雅娟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F40/30 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 搜索 结果 播报 方法 装置 | ||
1.一种基于人工智能的搜索结果播报方法,其特征在于,包括以下步骤:
接收用户输入的查询语句,并根据所述查询语句获取多个候选搜索结果;
对所述候选搜索结果进行分析,以确定所述候选搜索结果的类别,其中,所述类别包括结构化结果和富文本结果;
获取所述查询语句的意图信息,根据所述意图信息和所述类别筛选所述候选搜索结果,以获取筛选后的搜索结果,其中,将所述查询语句切分为多个单词或短语,分析所述单词的字面特征、语义特征和对于查询语句的重要度特征,根据上述特征分析出所述查询语句的意图信息,再结合所述候选搜索结果的类别筛选出符合播报条件的搜索结果,当所述查询语句的意图信息确定为无语音播报的意图时,过滤掉所述查询语句对应的搜索结果,当所述查询语句的意图为有语音播报的意图时,过滤掉搜索结果中不是结构化结果和富文本结果的搜索结果;以及
生成所述筛选后的搜索结果对应的文本信息,并播报所述文本信息,根据所述结构化结果生成对应的文本信息和根据富文本结果生成对应的文本信息的方式不同。
2.如权利要求1所述的方法,其特征在于,对所述候选搜索结果进行分析,以确定所述候选搜索结果的类别,包括:
获取所述候选搜索结果对应的页面内容信息;
对所述页面内容信息进行解析,并提取所述页面内容信息对应的数据特征;
根据所述数据特征确定所述候选搜索结果的类别。
3.如权利要求1所述的方法,其特征在于,当所述候选搜索结果的类别为结构化结果时,生成筛选后的搜索结果对应的文本信息,包括:
提取所述结构化结果中包含的多个字段;
计算每个字段对于所述结构化结果的重要度,并根据所述重要度获取符合预设条件的候选字段;
根据所述候选字段生成多个候选文本信息;
计算所述查询语句与所述候选文本信息的相似度,并根据所述相似度对所述候选文本信息进行排序,以及根据排序结果生成筛选后的搜索结果对应的文本信息。
4.如权利要求3所述的方法,其特征在于,在根据所述候选字段生成多个候选文本信息后,还包括:
对所述候选文本信息进行口语播报化改写。
5.如权利要求3所述的方法,其特征在于,计算所述查询语句与所述候选文本信息的相似度,包括:
基于广义语言模型计算所述查询语句与所述候选文本信息的相似度,其中,所述相似度包括字面相似度、语义相似度、播报风格相似度中的一种或多种。
6.如权利要求3所述的方法,其特征在于,根据所述相似度对所述候选文本信息进行排序,包括:
基于预设排序模型对所述候选文本信息进行排序,所述预设排序模型包括线性回归Linear-Regression排序模型、组合分析Pair-Wise排序模型。
7.如权利要求1所述的方法,其特征在于,当所述候选搜索结果的类别为富文本结果时,生成筛选后的搜索结果对应的文本信息,包括:
对所述富文本结果进行预处理,所述预处理包括文本抽取、文本去重、关键词分析、文本结构分析中的一种或多种;
基于广义语言模型提取所述富文本结果中多个候选语句的特征,所述特征包括所述候选语句与所述查询语句的语义相似度和/或意图相似度、所述候选语句在对应的富文本结果中的位置信息、所述候选语句包含的关键词信息中的一种或多种;
根据所述特征计算所述候选语句的得分;
根据所述得分对所述候选语句进行排序,以及根据排序结果生成筛选后的搜索结果对应的文本信息。
8.如权利要求1所述的方法,其特征在于,播报所述文本信息,包括:
基于TTS语音合成技术将所述文本信息合成为语音信息,并播报所述语音信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610116708.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:元件名称生成方法及系统
- 下一篇:基于双层模型体系的无线传感网的数据采集方法