[发明专利]用于微信公众平台的信息搜索方法及系统、装置在审
| 申请号: | 201910557896.6 | 申请日: | 2019-06-25 |
| 公开(公告)号: | CN110263262A | 公开(公告)日: | 2019-09-20 |
| 发明(设计)人: | 薄一峰;唐伟敏 | 申请(专利权)人: | 苏州梦嘉信息技术有限公司 |
| 主分类号: | G06F16/9536 | 分类号: | G06F16/9536 |
| 代理公司: | 苏州华博知识产权代理有限公司 32232 | 代理人: | 孟宏伟 |
| 地址: | 215000 江苏省苏州市工业*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文档集合 平台服务器 数据接口 搜索关键词 文档数据 信息搜索 分类 文档数据结构 关联 关联文档 信息分类 有效解决 匹配 搜索 分析 运营 重复 | ||
1.一种用于微信公众平台的信息搜索方法,其特征在于,所述微信公众平台包括平台服务器,所述平台服务器包括与各微信公众号相关联的文档,所述信息搜索方法包括:
S1、接入所述平台服务器的数据接口;
S2、经由所述数据接口从所述平台服务器接收与预定微信公众号相关联的文档集合;
S3、对所述文档集合执行分类分析以获得所述文档集合的分类的文档数据结构;
S4、对所述分类的文档数据进行查重处理,且对于重复的文档数据进行删减;
S5、经由所述数据接口从所述平台服务器接收所述预定微信公众号的用户输入的搜索关键词;
S6、根据所述用户输入的搜索关键词从与所述预定微信公众号相关联的文档集合中匹配关联文档。
2.根据权利要求1所述的用于微信公众平台的信息搜索方法,其特征在于,所述步骤S3对所述文档集合执行分类分析以获得所述文档集合的分类的文档数据结构具体包括对所述文档集合执行分类处理以获得多个不同类别的文档子集,每个文档子集中的每篇文档具有相关联的分类标签以指示该篇文档所属的类别。
3.根据权利要求1所述的用于微信公众平台的信息搜索方法,其特征在于,所述步骤S4对所述分类的文档数据进行查重处理,且对于重复的文档数据进行删减具体包括以下步骤:
S401、判断所述分类的文档数据的标题与所述微信公众号历史记录中文档数据的标题是否重复;
若已重复,进入S402;若不重复,进入S5;
S402、对于重复的文档数据进行删减,更新所述文档数据。
4.根据权利要求3所述的用于微信公众平台的信息搜索方法,其特征在于,所述步骤S401判断所述分类的文档数据的标题与所述微信公众号历史记录中文档数据的标题是否重复具体包括以下步骤:
S4011、识别所述分类的文档数据的标题,对所述分类的文档数据的标题的文本进行提取;
S4012、识别所述微信公众号历史记录中文档数据的标题,对所述微信公众号历史记录中文档数据的标题的文本进行提取;
S4013、计算所述分类的文档数据的标题与所述微信公众号历史记录中文档数据的标题的文本相似度;
S4014、判断所述文本相似度与预设阈值的相对大小;
若所述相似度>预设阈值,判断为重复;
若所述相似度<预设阈值,判断为不重复。
5.根据权利要求1所述的用于微信公众平台的信息搜索方法,其特征在于,所述步骤S6中根据所述用户输入的搜索关键词从与所述预定微信公众号相关联的文档集合中匹配关联文档具体包括以下步骤:
S601、根据所述搜索关键词确定所述搜索关键词所属的类别;
S602、根据所述搜索关键词从所述搜索关键词所属的类别的文档子集的分类形式的文档数据结构查找所述关联文档。
6.根据权利要求1所述的用于微信公众平台的信息搜索方法,其特征在于,对所述文档集合执行分类处理以获得多个不同类别的文档子集包括:
采用SVM分类器或贝叶斯分类器对所述文档集合中的每篇文档执行文本分类;
将属于同一分类类别的文档划分为一个文档子集,并设置相应的文档子集标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州梦嘉信息技术有限公司,未经苏州梦嘉信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910557896.6/1.html,转载请声明来源钻瓜专利网。





