[发明专利]一种数据处理方法和系统在审
申请号: | 202011135069.7 | 申请日: | 2020-10-20 |
公开(公告)号: | CN112148761A | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 陈志明;胡泊;刘佳 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
主分类号: | G06F16/2457 | 分类号: | G06F16/2457;G06F16/953;G06F16/9535 |
代理公司: | 成都七星天知识产权代理有限公司 51253 | 代理人: | 袁春晓 |
地址: | 100193 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 系统 | ||
1.一种数据处理方法,其特征在于,包括:
获取结构化数据库,所述结构化数据库包括兴趣点字段以及品牌属性字段;
对所述结构化数据库中一条或多条记录中的每一条进行:
获取该记录的兴趣点字段内容,判断所述兴趣点字段内容是否为非品牌数据;
若是,则设置该记录的品牌属性字段内容以便将该记录标记为非品牌兴趣点;
若否,则将该记录的兴趣点字段内容与品牌数据表中的数据进行匹配,根据匹配结果,对该记录的品牌属性字段内容进行校准。
2.如权利要求1所述的方法,其特征在于,所述结构化数据库用于基于品牌关键词的兴趣点检索。
3.如权利要求1所述的方法,其特征在于,所述判断所述兴趣点字段内容是否为非品牌数据,包括:
检测所述兴趣点字段内容是否包含预设的一个或多个非品牌标识词;
若包含,确定所述兴趣点字段内容为非品牌数据。
4.如权利要求1所述的方法,其特征在于,所述品牌数据表包括以下字段中的一种或多种的组合:品牌名称、品牌别名、品牌类型、品牌编码以及品牌疑似名称。
5.如权利要求4所述的方法,其特征在于,所述将该记录的兴趣点字段内容与所述品牌数据表中的数据进行匹配,根据匹配结果,对该记录的品牌属性字段内容进行校准,包括:
对该记录的兴趣点字段内容进行归一化,得到其对应的归一化表达;
将所述归一化表达与所述品牌数据表中品牌疑似名称字段的数据进行匹配,若所述归一化表达与品牌疑似名称字段的数据中的至少一个相同,则设置该记录的品牌属性字段内容以便将该记录标记为非品牌兴趣点。
6.如权利要求5所述的方法,其特征在于,所述将该记录的兴趣点字段内容与所述品牌数据表中的数据进行匹配,根据匹配结果,对该记录的品牌属性字段内容进行校准,包括:
将所述归一化表达与所述品牌数据表中品牌名称字段或品牌别名字段的数据进行匹配;
若未匹配上品牌名称字段或品牌别名字段的数据,则将该记录输出,以便人工校准其品牌属性字段内容,否则获取来自品牌名称字段或品牌别名字段的数据中的至少一个匹配数据及其匹配程度;
将所述至少一个匹配数据中匹配程度最大的匹配数据所对应的品牌名称作为该记录的品牌属性字段内容。
7.如权利要求6所述的方法,其特征在于,所述匹配程度包括从大到小排列的以下内容:相同,以及头部相同或者尾部相同。
8.如权利要求6所述的方法,其特征在于,未匹配上品牌名称字段或品牌别名字段的数据的情形包括:
所述归一化表达不被所述品牌数据表中品牌名称字段或品牌别名字段的数据中的任一个包含;或者,所述归一化表达被所述品牌数据表中品牌名称字段或品牌别名字段的数据中的最多一个非头尾相同的包含。
9.一种数据处理系统,其特征在于,包括获取模块和处理模块;
所述获取模块用于获取结构化数据库,所述结构化数据库包括兴趣点字段以及品牌属性字段;
所述处理模块对所述结构化数据库中一条或多条记录中的每一条进行:
获取该记录的兴趣点字段内容,所述判断模块用于判断所述兴趣点字段内容是否为非品牌数据;
若是,所述处理模块用于设置该记录的品牌属性字段内容以便将该记录标记为非品牌兴趣点;
若否,所述处理模块用于将该记录的兴趣点字段内容与所述品牌数据表中的数据进行匹配,根据匹配结果,对该记录的品牌属性字段内容进行校准。
10.如权利要求9所述的数据处理系统,其特征在于,所述结构化数据库用于基于品牌关键词的兴趣点检索。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011135069.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:抗菌面料
- 下一篇:一种台区三相不平衡换相开关控制方法及装置