[发明专利]一种基于时空属性的实体竞争关系数据挖掘方法有效
| 申请号: | 201910388351.7 | 申请日: | 2019-05-10 |
| 公开(公告)号: | CN110110013B | 公开(公告)日: | 2020-03-24 |
| 发明(设计)人: | 乔少杰;李艾鲜;温敏;韩楠;魏军林;丁超;程维杰;叶青;彭京;周凯;徐小玲 | 申请(专利权)人: | 成都信息工程大学;四川省金科成地理信息技术有限公司 |
| 主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/951;G06F40/284 |
| 代理公司: | 成都正华专利代理事务所(普通合伙) 51229 | 代理人: | 李蕊;陈选中 |
| 地址: | 610225 四川省成都市双*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 时空 属性 实体 竞争 关系 数据 挖掘 方法 | ||
本发明公开了一种基于时空属性的实体竞争关系数据挖掘方法,将实体竞争关系探测与前沿的计算机技术相结合,克服了传统的竞争关系数据挖掘方法不考虑时空属性影响的缺点,科学的融合实体用户评论、实体用户评论时间和实体空间位置三大因素,科学精确的量化了实体间的竞争关系。本发明最终挖掘得到的实体竞争关系数据取值范围为[0,1],有效解决了传统的竞争关系挖掘方法和竞争对手识别方法结果对于非技术人员无法理解,最终还需要人工处理和筛选的问题。
技术领域
本发明属于数据挖掘技术领域,具体涉及一种基于时空属性的实体竞争关系数据挖掘方法的设计。
背景技术
目前在针对实体企业竞争关系的数据挖掘领域中,有些研究以用户评论为数据源,利用信息抽取技术从本企业产品评论中抽取用户较为关注的产品特征,基于情感分析技术设计特征情感权重算法对本企业产品特征进行优劣势分析挖掘出与本企业产品优势相似及劣势互补的候选竞争产品,并选择优势相似且劣势互补的产品为主要竞争对手,其他优势相似的产品为次要竞争对手;或者是通过分析网络链接提取竞争关系。上述竞争关系的数据挖掘方法是基于文本挖掘提取竞争关系数据,因为数据源受人的主观思想影响,所以挖掘结果带有主观性,客观程度不能得到保证。
还有一些研究开始以电子商务客观事实数据为分析数据源,结合以往的竞争关系挖掘方法进行分析挖掘,提升挖掘方法的客观性。传统的针对电子商务平台的数据挖掘工作一般是收集电商平台数据,然后从中挖掘可供使用的用户推荐、用户习惯等信息。利用产品信息(例如价格、功能以及销量等)挖掘竞争关系。该挖掘方法只考虑了商家(实体)信息对竞争关系的影响,而没有考虑到用户对竞争关系的影响。然而在实际生活中,无论实体是企业还是商店,用户(消费者)对竞争关系的影响是不容忽视的。因此单纯的根据实体信息挖掘实体竞争关系得到结果是存在较大偏差、不准确的。
此外,在专利网络中运用主题模型挖掘企业竞争关系是一种新兴的方法。但专利文件有其特殊性,这对实体类型有严格的要求(必须为拥有专利的企业),因此在实用性上存在局限性,方法的可移植性不强,不能适用于除企业外的其他实体。
上述这些方法和模型并没有把网络数据包括进来,随着社交网络的蓬勃发展,像微博、Twitter等社交网站为竞争关系挖掘带来了新的数据来源。这些新的数据源对竞争关系分析方法和竞争关系挖掘技术提出了新的要求。因此,利用社交网络数据来挖掘实体竞争关系数据是一个新兴的研究点。通过分析用户评论,挖掘数据时间、空间上存在的特征,分析实体间的竞争关系,可以更好的为企业发展和决策提供支撑。
现有的竞争关系数据挖掘研究,注重于实体专利数据和实体网络用户评论数据的挖掘,而忽视了数据的时间特征和空间特征。通过融合数据的时空属性,可以进一步改进现有的竞争关系数据挖掘方法,从而提升挖掘模型的实用性、客观性和准确性。
发明内容
本发明的目的是为了解决现有的竞争关系数据挖掘方法并未考虑时空属性的影响,无法准确识别和科学量化竞争关系,并且挖掘输出结果需要人工整理、识别才能被非技术人员看懂的问题,提出了一种基于时空属性的实体竞争关系数据挖掘方法。
本发明的技术方案为:一种基于时空属性的实体竞争关系数据挖掘方法,包括以下步骤:
S1、通过网络爬虫程序爬取实体的用户评论数据、实体的用户评论时间数据以及实体的经纬度数据。
S2、对实体的用户评论数据进行预处理。
S3、采用LDA对预处理后实体的用户评论数据进行主题提取,得到用户评论主题。
S4、根据用户评论主题构建主题-特征匹配规则,并根据主题-特征匹配规则计算得到实体的主题-特征匹配值。
S5、根据实体的经纬度数据计算得到实体距离量化值。
S6、根据实体的用户评论时间数据计算得到实体时间属性影响力量化值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都信息工程大学;四川省金科成地理信息技术有限公司,未经成都信息工程大学;四川省金科成地理信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910388351.7/2.html,转载请声明来源钻瓜专利网。





