[发明专利]基于商品网络化基因的品牌知识产权保护平台在审
| 申请号: | 201410368754.2 | 申请日: | 2014-07-30 |
| 公开(公告)号: | CN104123659A | 公开(公告)日: | 2014-10-29 |
| 发明(设计)人: | 刘浩;陈贤;刘卫平 | 申请(专利权)人: | 杭州野工科技有限公司 |
| 主分类号: | G06Q30/00 | 分类号: | G06Q30/00;G06F17/30 |
| 代理公司: | 杭州赛科专利代理事务所 33230 | 代理人: | 曹绍文 |
| 地址: | 310000 浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 商品 网络化 基因 品牌 知识产权保护 平台 | ||
技术领域
本发明涉及一种维权网络平台,尤其涉及一种基于商品网络化基因的品牌知识产权保护平台。
背景技术
目前打假行业基本处于技术比较滞后的状态,在筛选售假商品时,基本采用人工方式查看或消费者举报,之后再通过法律维权的方式,维护自身的品牌知识产权不受侵害。这种方法成本很高,效果一般。随着电子商务的发展,电子商务平台的特殊性,使得售假商家更加隐蔽,打击侵权更加艰难。企业自身由于技术水平和资金的有限性,难以利用有效的数据分析从海量数据中获取售假信息,尽管各个企业每年投入的巨大的费用,增加人力物力,难以防范日益增长的假货侵权,传统打假维权方法的局限性凸显。
发明内容
本发明为了解决上述现有技术存在的缺陷和不足,提供了一种可以用更少的人力物力,有效的处理更大规模的市场,减少企业知识产权维护的成本,从而带来经济效益提升的基于商品网络化基因的品牌知识产权保护平台。
本发明的技术方案:一种基于商品网络化基因的品牌知识产权保护平台,包括数据源模块、数据收集模块、数据整合模块、数据存储模块、数据分析模块、目标检测模块、可视化模块和数据应用模块,
数据收集模块,收集数据源数据时,利用开源的Hadoop平台构建分布式全网商品数据抓取系统;
数据整合模块,将从数据源收集到的数据通过系统建立的SKU库和SKU特征库,对不同来源的商品进行唯一性识别,并对非结构化数据进行结构化整理和清洗;
数据存储模块,将整合好的数据存储进入数据仓库,为数据分析提供支持;
数据分析模块,对大量非结构化的商品评论数据,进行结构化的整理;
目标检测模块,通过建立的侵权商品识别模型,分析检测到疑似侵权商品;
可视化模块,将分析检测到的疑似侵权商品,通过可视化界面展现给客户。
本发明采用的开源的Hadoop平台构建分布式全网商品数据抓取系统具有以下几个特点: 1)高性能高稳定性。系统实现了多线程的分布式抓取,独立抓取进程前互不影响,当某抓取任务失败后能实现自动恢复机制,实现99.99%以上的爬虫工作稳定性,并可根据业务需求迅速横向爬虫规模。2)抓取系统的调度算法,根据客户重要程度和上次监测时间,合理安排爬虫工作权重,实现对新客户和重要客户的迅速反应。3)抓取系统上下文环境记忆,实现对不同来源商品页相应数据上次爬取的上下文环境记录系统,保证抓取系统实现增量的数据更新。
本发明数据整合模块中元数据定义是数据清洗最重要的前置步骤。SKU(Simple Keep Unit)即电子商务销售流程中商品的最小表现形式,但互联网上商品销售时名称多样,商品编码不同,实现商品知识产权保护要实现维权商品SKU元数据定义。本发明根据打假需要定义了自有平台的商品元数据的SKU格式和识别特征(见图3商品数据元SKU定义),利用个各个平台开放接口及自有数据采集系统将散落在各大电商平台及社会化媒体平台上的相应各种结构化、半结构化和非结构化数据,统一整合到自有数据平台中的商品库中,为商品的数据的进一步挖掘提供基础。
优选地,所述数据收集模块收集来自各个独立渠道的数据,该些数据包括企业自有数据,即在企业自有平台上可以收集到的一切相关产品数据;电商平台上相关产品的数据;微博平台上相关产品的数据;以及其他相关论坛上各种商品相关数据。
优选地,所述数据分析模块首先通过自然语言处理技术,提取产品特征和用户观点关键词;然后建立中文极性判断词库,定义不同关键词所表达观点的极性,最后通过关键词极性判断,将商品评论转化为可计算的数据格式。
优选地,特征关键词提取主要通过对评论文本预处理,基于高频词统计、低频词句法依赖和人工模式添加,提取商品评论特征,基本实现对商品评论信息中主要评论特征的覆盖。
优选地,关注分析和研究现有的商品特征抽取方法,进一步改善基于统计和模式匹配的商品特征词抽取方法。
优选地,研究和改善了基于最大熵、基于SVM、基于决策树等多种句子依存关系的分析方法对观点词抽取的影响,进一步提高对商品特征词、用户观点的抽取准确率。
优选地,中文极性判断词库的建立进一步构建基于HowNet的中文极性判断词库,同时扩充网络语义极性词库和加入同义词词库对同义词进行极性判断和分析,增加对极性强度的程序判断,提高对用户评价中极性同义词极性判断准确率。
优选地,通过中文极性判断词库,将用户的评论观点结构化为可计算处理的数据格式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州野工科技有限公司,未经杭州野工科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410368754.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:睡眠质量监控装置和方法
- 下一篇:银行后台TPS交易事件趋势预测方法及系统





