[发明专利]一种基于深度学习的用户聚类搜索系统有效
申请号: | 202110336144.4 | 申请日: | 2021-03-29 |
公开(公告)号: | CN112883281B | 公开(公告)日: | 2022-10-14 |
发明(设计)人: | 李麒 | 申请(专利权)人: | 杭州同声相应科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 北京方圆嘉禾知识产权代理有限公司 11385 | 代理人: | 李佳川 |
地址: | 310000 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 用户 搜索 系统 | ||
本发明公开了一种基于深度学习的用户聚类搜索系统,包括搜索词库、搜索单元和结果显示单元,还包括用户单元和历史数据库,历史数据库内存储有最近第一时间周期内进行搜索过的词汇信息,所述用户单元包括若干不同的用户特征模型和用户模型数据库,用户模型数据库包括活跃词区,所述活跃词区包含若干活跃词汇,活跃词汇为在最近第二时间周期内搜索次数大于第一数值的词汇;搜索单元配置有搜索词匹配策略,所述搜索单元包括搜索工具。本发明提供了一种基于深度学习的用户聚类搜索系统,通过建立用户特征模型,采用协同过滤推荐算法推测用户的搜索意向,以期提高用户搜索体验、快速达成搜索目的。
技术领域
本发明涉及数据分析技术领域,具体为一种基于深度学习的用户聚类搜索系统。
背景技术
基于统计学原理的人工智能(比人类思维客观):人工智能是指制造具有智能的机器的科学和技术。基于统计学原理的人工智能是当今主流的机器学习方法,它与其它方法的主要区别在于它的数学基础不是逻辑和规则推理,而是统计学准则和原理。它从一组观测数据推算问题世界的数学模型。
互联网用户的行为如同人类的思维一样,丰富而复杂。在对互联网数据挖掘的过程中,关键词占据着主要的地位,及用户访问的页面和用户喜欢的内容都可以通过“关键词”来刻画。基于统计学原理的人工智能给在搜索系统中对互联网用户的用户行为分析提供了基础思想。
集体智慧是一种共享的或者群体的智能,它是从许多个体的合作与竞争中涌现出来的,集体智慧在细菌、动物、人类以及计算机网络中形成,并以多种形式的协商一致的决策模式出现。集体智慧也给在搜索系统中对互联网用户的用户行为分析提供了基本的解决问题的思路。
在现在的互联网搜索系统中期望提高用户搜索体验、快速达成用户搜索目的是大家都在努力研究的课题。
发明内容
本发明的目的在于提供了一种基于深度学习的用户聚类搜索系统,通过建立用户特征模型,采用协同过滤推荐算法推测用户的搜索意向,以期提高用户搜索体验、快速达成搜索目的。
为实现上述目的,本发明提供如下技术方案:一种基于深度学习的用户聚类搜索系统,包括搜索词库、搜索单元和结果显示单元,还包括用户单元和历史数据库,所述历史数据库内存储有最近第一时间周期内进行搜索过的词汇信息,所述用户单元包括若干不同的用户特征模型和用户模型数据库,所述用户模型数据库包括活跃词区,所述活跃词区包含若干活跃词汇,所述活跃词汇为在最近第二时间周期内搜索次数大于第一数值的词汇;
所述搜索单元配置有搜索词匹配策略,所述搜索单元包括搜索工具,所述搜索工具包括搜索框、搜索启动项,所述搜索词匹配策略包括候选词排序子策略,所述搜索词匹配策略被配置为实时获取搜索框内输入的第一搜索词信息,并按照候选词排序子策略调取用户模型数据库、历史数据库或搜索词库里的词汇信息生成搜索词候选词条,所述搜索词候选词条包含若干条搜索候选词;
所述搜索工具配置有第一搜索策略和相关度对比策略,所述第一搜索策略包括筛选所述活跃词区包含第一搜索词信息的数据生成用户意向搜索子词区,并将所述用户意向搜索子词区内的词汇信息按照活跃度值由高到低进行排序,并筛选所述历史数据库中包含所述第一搜索词信息的数据生成历史意向搜索子词区,并将所述历史意向搜索子词区内的词汇信息按照活跃度值由高到低进行排序;
所述相关度对比策略用于按照活跃度值由高到低的顺序分别计算所述用户意向搜索子词区和历史意向搜索子词区中的词汇信息与所述第一搜索词信息的相关度并生成相关值;
所述候选词排序子策略包括第一阈值、第二阈值、第三阈值和第四阈值,所述候选词排序子策略被配置为将所述用户意向搜索子词区内活跃度值大于第一阈值且相关值大于第二阈值的词汇信息和所述历史意向搜索子词区内活跃度值大于第一阈值且相关值大于第二阈值的词汇信息交错显示在所述搜索词候选词条内。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州同声相应科技有限公司,未经杭州同声相应科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110336144.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于数据库的数据处理方法、装置及计算机可读介质
- 下一篇:一种连线剥单机