[发明专利]目标人群数据采集分类方法在审
申请号: | 201810308884.5 | 申请日: | 2018-04-09 |
公开(公告)号: | CN110362654A | 公开(公告)日: | 2019-10-22 |
发明(设计)人: | 谢碧青 | 申请(专利权)人: | 谢碧青 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06Q30/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610000 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 采集软件 查询内容 目标人群 输入软件 数据采集 摘要信息 抽取 集合 文本 采集模块分析 产品类别 对比分析 分类算法 目标用户 匹配需求 输入语句 主题信息 自动文摘 子主题 分类 聚类 算法 数据库 查询 | ||
本发明公开了目标人群数据采集分类方法,A、用户通过输入软件输入语句;B、输入软件的采集模块分析出关键词,根据关键词进行查询,得出查询内容;C、采集软件对查询内容的主题信息提供聚类和分类算法,将查询内容分为多个主题的集合;D、采集软件对主题的特征,提供不同的自动文摘算法,为主题或子主题集合抽取出相应的文本摘要信息;E、采集软件抽取文本摘要信息中产品类别词,和采集软件中的数据库进行对比分析,得出匹配需求的目标用户。
技术领域
本发明涉及一种大数据分析,具体涉及一种目标人群数据采集分类方法。
背景技术
大数据,指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。在日新月异的网络时代,其网络语言不紧时文化时代的新产物,网络语言从网络中产生或应用于网络交流的一种语言,包括中英文字母、标点、符号、拼音、图标、图片和文字等多种组合。这种组合,往往在特定的网络媒介传播中表达特殊的意义,在实际生活中,如能具体分析出这些语言片段,对其语言研究分析可提供很大的参考价值。
发明内容
本发明提供了目标人群数据采集分类方法,用于分析用户的需求习惯,弄好的为用户推荐搜索内容,方便用户找到自己想要的内容。
本发明通过下述技术方案实现:
目标人群数据采集分类方法,主要包括以下步骤:A、用户通过输入软件输入语句;B、输入软件的采集模块分析出关键词,根据关键词进行查询,得出查询内容;C、采集软件对查询内容的主题信息提供聚类和分类算法,将查询内容分为多个主题的集合;D、采集软件对主题的特征,提供不同的自动文摘算法,为主题或子主题集合抽取出相应的文本摘要信息;E、采集软件抽取文本摘要信息中产品类别词,和采集软件中的数据库进行对比分析,得出匹配需求的目标用户。
进一步的,步骤B中的查询是扩展查询,其中扩展查询包括语义扩展查询、拼音扩展查询和关键字联想查询。采用本步的有益效果是方便用于能够更加完整的得到数据。
进一步的,在步骤C之后,还可以通过与目标词汇做对比,找出目标人群中与目标词汇相对应的人群。根据需求找到所要需要的人群,针对性更强。
本发明具有如下的优点和有益效果:
1、本发明通过分析用户的输入信息,对信息进行关键词提取,通过关键词进行内搜索,以及关联内容搜索,通过对搜索的内容进行摘要信息提取,通过提取的信息进行分类,了解用户潜在喜好以及用户潜在需求;
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例1
目标人群数据采集分类方法,A、用户通过输入软件输入语句;B、输入软件的采集模块分析出关键词,根据关键词进行查询,得出查询内容;C、采集软件对查询内容的主题信息提供聚类和分类算法,将查询内容分为多个主题的集合;D、采集软件对主题的特征,提供不同的自动文摘算法,为主题或子主题集合抽取出相应的文本摘要信息;E、采集软件抽取文本摘要信息中产品类别词,和采集软件中的数据库进行对比分析,得出匹配需求的目标用户;步骤B中的查询是扩展查询,其中扩展查询包括语义扩展查询、拼音扩展查询和关键字联想查询。采用本步的有益效果是方便用于能够更加完整的得到数据;在步骤C之后,还可以通过与目标词汇做对比,找出目标人群中与目标词汇相对应的人群。根据需求找到所要需要的人群,针对性更强。实施时,可通过网络云服务平台进行语言处理,通过单位链之间的协同工作,对其大平台进行分析处理,通过设置过滤常用辅助形表达词汇,增加其对比效率。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谢碧青,未经谢碧青许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810308884.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于品牌名称相似度比对软件的方法
- 下一篇:一种潜在流行性元素发觉方法