[发明专利]基于人工智能的检索语句语义片段获取方法、装置及终端有效
| 申请号: | 201710466186.3 | 申请日: | 2017-06-19 |
| 公开(公告)号: | CN107357830B | 公开(公告)日: | 2020-07-28 |
| 发明(设计)人: | 吴玉芳 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 人工智能 检索 语句 语义 片段 获取 方法 装置 终端 | ||
1.一种基于人工智能的检索语句语义片段获取方法,其特征在于,包括:
对获取的检索语句进行预处理,确定所述检索语句中包括的第一主体词及语义片段集;
根据历史检索数据,确定所述语义片段集中各语义片段与所述第一主体词间的关联度;
根据所述各语义片段与所述第一主体词间的关联度,对所述语义片段集进行过滤处理,确定与所述检索语句对应的目标语义片段集。
2.如权利要求1所述的方法,其特征在于,所述确定所述检索语句中包括的第一主体词及语义片段集,包括:
对获取的检索语句进行切词处理,确定所述检索语句中包含的分词序列;
根据预设的主体词列表,确定所述分词序列中包含的第一主体词。
3.如权利要求2所述的方法,其特征在于,所述预设的主体词列表,包括预设的名词列表和预设的专名实体词列表,所述确定所述分词序列中包含的第一主体词,包括:
判断所述检索语句的句尾包括的第一分词,是否在预设的名词列表中;
若是,则确定所述第一分词为所述第一主体词;
若否,则判断所述检索语句的句首包括的第二分词,是否在预设的专名实体词列表;
若在,确定所述第二分词为所述第一主体词。
4.如权利要求1所述的方法,其特征在于,所述根据历史检索数据,确定所述语义片段集中各语义片段与所述第一主体词间的关联度,包括:
对历史检索数据进行数据训练,确定所述历史检索数据中包含的各语义片段与各主体词间的关联度表;
通过查询所述关联度表,确定所述语义片段集中各语义片段与所述第一主体词间的关联度。
5.如权利要求4所述的方法,其特征在于,所述对历史检索数据进行数据训练之前,还包括:
获取历史检索数据;
根据检索频次、满意度、和/或点击量,对所述历史检索数据进行清洗;
所述对历史检索数据进行数据训练,包括:
对清洗后的历史检索数据进行数据训练。
6.如权利 要求1-5任一所述的方法,其特征在于,所述确定与所述检索语句对应的目标语义片段集之后,还包括:
根据所述历史检索数据,依次确定与目标语义片段集中各目标语义片段组合后被检索的主体词的数量;
根据与各目标语义片段组合后被检索的主体词的数量,确定各目标语义片段的置信度;
根据所述各目标语义片段的置信度,对所述目标语义片段集进行更新处理。
7.如权利要求6所述的方法,其特征在于,所述确定各目标语义片段的置信度之后,还包括:
根据所述各目标语义片段获取检索结果;
根据所述各目标语义片段的置信度,确定所述检索结果的显示顺序。
8.一种基于人工智能的检索语句语义片段获取装置,其特征在于,包括:
第一确定模块,用于对获取的检索语句进行预处理,确定所述检索语句中包括的第一主体词及语义片段集;
第二确定模块,用于根据历史检索数据,确定所述语义片段集中各语义片段与所述第一主体词间的关联度;
第三确定模块,用于根据所述各语义片段与所述第一主体词间的关联度,对所述语义片段集进行过滤处理,确定与所述检索语句对应的目标语义片段集。
9.如权利要求8所述的装置,其特征在于,所述第一确定模块,包括:
第一确定单元,用于对获取的检索语句进行切词处理,确定所述检索语句中包含的分词序列;
第二确定单元,用于根据预设的主体词列表,确定所述分词序列中包含的第一主体词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710466186.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:缩放比例处理方法及装置
- 下一篇:可配置的流程实例数据分布式存储方法及系统





