[发明专利]一种基于深度学习的用户聚类搜索系统有效
| 申请号: | 202110336144.4 | 申请日: | 2021-03-29 |
| 公开(公告)号: | CN112883281B | 公开(公告)日: | 2022-10-14 |
| 发明(设计)人: | 李麒 | 申请(专利权)人: | 杭州同声相应科技有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
| 代理公司: | 北京方圆嘉禾知识产权代理有限公司 11385 | 代理人: | 李佳川 |
| 地址: | 310000 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 用户 搜索 系统 | ||
1.一种基于深度学习的用户聚类搜索系统,包括搜索词库、搜索单元和结果显示单元,其特征在于,还包括用户单元和历史数据库,所述历史数据库内存储有最近第一时间周期内进行搜索过的词汇信息,所述用户单元包括若干不同的用户特征模型和用户模型数据库,所述用户模型数据库包括活跃词区,所述活跃词区包含若干活跃词汇,所述活跃词汇为在最近第二时间周期内搜索次数大于第一数值的词汇;
所述用户模型数据库还包括典型词汇区和高权重词汇区,所述高权重词汇区内包含代表用户特性和习惯的若干固定高权重词汇,所述典型词区包含若干典型词汇,所述典型词汇根据所述历史数据库内的高权重词汇出现的频率和次数进行计算筛选得出;
所述用户单元包括用户模型构建策略,所述用户模型构建策略包括根据所述典型词汇出现的频率和次数进行计算和归类并生成用户特征模型;
所述搜索单元配置有搜索词匹配策略,所述搜索单元包括搜索工具,所述搜索工具包括搜索框、搜索启动项,所述搜索词匹配策略包括候选词排序子策略,所述搜索词匹配策略被配置为实时获取搜索框内输入的第一搜索词信息,并按照候选词排序子策略调取用户模型数据库、历史数据库或搜索词库里的词汇信息生成搜索词候选词条,所述搜索词候选词条包含若干条搜索候选词;
所述搜索工具配置有第一搜索策略和相关度对比策略,所述第一搜索策略包括筛选所述活跃词区包含第一搜索词信息的数据生成用户意向搜索子词区,并将所述用户意向搜索子词区内的词汇信息按照活跃度值由高到低进行排序,并筛选所述历史数据库中包含所述第一搜索词信息的数据生成历史意向搜索子词区,并将所述历史意向搜索子词区内的词汇信息按照活跃度值由高到低进行排序;
所述相关度对比策略用于按照活跃度值由高到低的顺序分别计算所述用户意向搜索子词区和历史意向搜索子词区中的词汇信息与所述第一搜索词信息的相关度并生成相关值;
所述候选词排序子策略包括第一阈值、第二阈值、第三阈值和第四阈值,所述候选词排序子策略被配置为将所述用户意向搜索子词区内活跃度值大于第一阈值且相关值大于第二阈值的词汇信息和所述历史意向搜索子词区内活跃度值大于第一阈值且相关值大于第二阈值的词汇信息交错显示在所述搜索词候选词条内;
所述第一搜索策略还包括群体意向子策略,所述群体意向子策略包括获取与当前用户属于同一用户特征模型的其他用户的活跃词区形成群体活跃词区,所述第一搜索策略还配置有筛选所述群体活跃词区内包含第一搜索词信息的数据生成群体意向搜索子词区,将所述群体意向搜索子词区内的词汇信息按照活跃度值由高到低进行排序,并将活跃值大于第六阈值的词汇信息穿插在原有搜索词候选词条内进行间隔显示;
所述搜索工具还配置有备选搜索策略,所述备选搜索策略包括群体意向子策略,所述备选搜索策略包括当所述按照所述第一搜索策略生成的搜索词候选词条内包含的搜索候选词小于第七阈值时执行群体意向子策略,所述群体意向子策略包括获取与当前用户属于同一用户特征模型的其他用户的活跃词区形成群体活跃词区,并筛选所述群体活跃词区内包含第一搜索词信息的数据生成群体意向搜索子词区,将所述群体意向搜索子词区内的词汇信息在原有搜索词候选词条之后按照活跃度值由高到低进行的排序进行显示;
通过建立用户特征模型,并且设置活跃词区,通过活跃词生成用户意向搜索子词区,以获得用户最新的搜索意向,并且通过设置有群体意向子策略获取与当前用户属于同一用户特征模型的其他用户的活跃词区形成群体活跃词区;采用协同过滤推荐算法预测相同喜好的用户的搜索意向,以提高用户搜索体验、快速达成搜索目的。
2.根据权利要求1所述的一种基于深度学习的用户聚类搜索系统,其特征在于:所述结果显示单元包括结果项数据库,所述结果项数据库内包含若干结果项信息,所述结果显示单元配置有第二搜索策略,所述第二搜索策略包括当搜索启动项响应后,获取此时搜索框内输入的搜索整词,并根据所述搜索整词筛选所述结果项数据库内与之相匹配的结果项信息生成搜索结果数据包。
3.根据权利要求2所述的一种基于深度学习的用户聚类搜索系统,其特征在于:所述结果显示单元还配置有结果显示排序策略,所述结果显示排序策略包括将结果数据包内包含该用户的典型词汇的结果项信息按照其所述包含的典型词汇的活跃度由高到低进行相应排序,其余结果项信息随机排其之后。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州同声相应科技有限公司,未经杭州同声相应科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110336144.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于数据库的数据处理方法、装置及计算机可读介质
- 下一篇:一种连线剥单机





