[发明专利]一种价格分析方法及装置在审
申请号: | 201710685511.5 | 申请日: | 2017-08-11 |
公开(公告)号: | CN109389453A | 公开(公告)日: | 2019-02-26 |
发明(设计)人: | 孙鹏飞;殷太兵 | 申请(专利权)人: | 苏宁云商集团股份有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 苏一帜 |
地址: | 210042 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 价格区间 价格分析 关键词信息 商品数据 聚类 热度 电子商务领域 关联 样本数据 类目 预设 集合 输出 分析 | ||
1.一种价格分析方法,其特征在于,包括:
获取关键词信息和与所述关键词信息相关联的类目,并提取所述相关联的类目下的商品数据;
对所获取的商品数据进行聚类,并根据聚类的结果划分商品的价格区间,所述价格区间根据区间划分模型进行划分,所述区间划分模型通过预设的样本数据集合得到;
对所获取的价格区间进行热度计算,并输出热度计算结果。
2.根据权利要求1所述的方法,其特征在于,还包括:
对所述样本数据集合进行数据特征提取,并识别出异常数据;
利用所述异常数据对所述样本数据集合进行平滑处理,并根据经过所述平滑处理的所述样本数据集合生成区间划分模型。
3.根据权利要求2所述的方法,其特征在于,所述对所述样本数据集合进行数据特征提取,并识别出异常数据,包括:
从所述样本数据集合中提取n个数据对象,并从所提取的数据对象中选择2个作为初始聚类中心,其中,n≥3;
根据与所述初始聚类中心之间的相似度,将所述初始聚类中心之外的数据对象,分配至各自最相似的类簇中,得到聚类的新簇;
计算所得到的聚类的类簇,得到各新簇中的数据对象的均值;
根据所述各新簇中的数据对象的均值和预设的阈值进行异常值识别,确定异常数据。
4.根据权利要求3所述的方法,其特征在于,所述从所提取的数据对象中选择2个作为初始聚类中心,包括:从25分位点和75分位点各自选取一个数据对象,作为初始聚类中心。
5.根据权利要求3所述的方法,其特征在于,还包括:
对从所述样本数据集合中的数据对象,进行标准化数值处理,得到各数据对象的Z分数;
将Z分数低于下限值或高于上限值的数据对象,确定为异常数据。
6.根据权利要求1所述的方法,其特征在于,所述对所获取的价格区间进行热度计算,包括:
获取所获取的各价格区间对应的网络行为概率,其中,对应一个价格区间的网络行为概率包括:这一个价格区间下的商品的网络行为之和,与所有区间下的商品的网络行为之和的商值;
根据所述网络行为概率,建立各价格区间对应的热度计算模型,并计算各价格区间的热度。
7.根据权利要求6所述的方法,其特征在于,所述获取所获取的各价格区间对应的网络行为概率,包括:
根据确定各价格区间对应的网络行为概率,其中,Pi(s)为与所述关键词信息相关联的类目s所对应的第i个价格区间的概率,Ni(s)为与所述关键词信息相关联的类目s所对应第i个价格区间对应的网络行为次数,k为价格区间的个数,所述网络行为包括对于商品的浏览、购买、收藏、点击行为;
所述计算各价格区间的热度,包括:
对于一个价格区间,获取这一个价格区间的网络行为概率的熵与所有价格区间的网络行为概率的熵之和的商值,并作为这一个价格区间的热度值其中Hi(s)第i个价格区间的熵,Pi(s)为第i个价格区间的网络行为概率,n为网络行为的种类,K为价格区间的个数,λ为引入的拉普拉斯平滑系数。
8.一种价格分析装置,其特征在于,包括:
接收模块,用于获取关键词信息和与所述关键词信息相关联的类目,并提取所述相关联的类目下的商品数据;
第一分析模块,用于对所获取的商品数据进行聚类,并根据聚类的结果划分商品的价格区间,所述价格区间根据区间划分模型进行划分,所述区间划分模型通过预设的样本数据集合得到;
第二分析模块,用于对所获取的价格区间进行热度计算,并输出热度计算结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁云商集团股份有限公司,未经苏宁云商集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710685511.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:语音销售的方法及装置
- 下一篇:贩卖界面整合系统