[发明专利]一种新共享经济项目自动挖掘分析方法有效
申请号: | 201910200109.2 | 申请日: | 2019-03-15 |
公开(公告)号: | CN109949088B | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 张岩;刘波;董伟;刘斌;赵然;姚鹏飞 | 申请(专利权)人: | 中科钢研节能科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q30/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 共享 经济 项目 自动 挖掘 分析 方法 | ||
1.一种新共享经济项目自动挖掘分析方法,其利用一种新共享经济项目自动挖掘分析系统以进行,其特征在于,所述新共享经济项目自动挖掘分析系统包括:
系统服务器,该系统服务器上具备一系统软件平台,该软件平台进行计算、给出图表、审核系统服务器输出和输入的数据;所述系统服务器中具备第一存储器,该第一存储器专用于存储项目可行性报告;在系统软件平台中选定限定类别;
需求信息服务器,其用于记录从多个电子商务信息平台接收到的原始商品搜索信息,所述原始商品搜索信息被逐条记录在需求信息服务器内,且每一条所记录的原始商品搜索信息都至少包含搜索本文信息、搜索位置信息、搜索设备名称;且所述原始商品搜索信息被限定为仅关注某实际地域内的信息;所述原始商品搜索信息收集时通过语义分析,排除非所述限定类别的内容;所述需求信息服务器中还具有第二存储器;
供货信息服务器,其用于记录从经专家终端确认过的供货网站地址所接收到的原始供货信息,所述原始供货信息被逐条记录在供货信息服务器内,且每一条所记录的原始供货信息都至少包含供货品名信息、供货数量信息和供货位置信息;且所述原始供货信息被限定为仅关注某实际地域内的信息;所述原始供货信息收集时通过语义分析,排除非所述限定类别的内容;所述需求信息服务器中还具有第三存储器;
商品释义服务器,其上存储有限定类别下的复数个商品释义集群信息,每一条所述商品释义集群信息,都包含正式名一个以及多个数量可不断补充的引申词;所述商品释义服务器上具备语义分析引擎软件,该语义分析引擎软件能够自动对文本信息进行名词的提取,并可将所提取的名词依据语义的相似度生成所述商品释义集群信息;
区域需求服务器组,其具有N个区域需求服务器,每个区域需求服务器都对应所述某实际地域内的不同的实际区域范围,且任意两个区域需求服务器所对应的实际区域范围不叠加也不重合;N为正整数;
区域供货服务器组,其具有N个区域供货服务器,每个区域供货服务器都对应所述某实际地域内的不同的实际区域范围,且任意两个区域供货服务器所对应的实际区域范围不叠加也不重合;N为正整数;
专家终端组,其具有ZZ个专家终端,用于从专家用户搜集信息并与前述系统服务器、需求信息服务器、供货信息服务器、商品释义服务器、区域需求服务器组、区域供货服务器组进行数据交互,ZZ为大于等于300的正整数;
认证服务器,其上具有预存的管理人员信息组,所述管理人员信息组中具有按人员ID号分条目存储的加密识别信息,所述加密识别信息包括但不限于人员的预留码信息、指纹信息、虹膜信息、面部图像信息;
管理终端组,其由数量至少为G的管理终端组成,每个管理终端都通过无线方式接收信息并与前述系统服务器、需求信息服务器、供货信息服务器、商品释义服务器、区域需求服务器组、区域供货服务器组、认证服务器进行数据交互;G为大于或等于100的整数;
所述搜索设备名称具体是进行搜索的设备在互联网的对外名称、或者进行搜索的设备的网卡MAC地址或手机标识码;
所述需求信息服务器和供货信息服务器都各自有一个或多个需求镜像服务器和供货镜像服务器,所述需求镜像服务器和供货镜像服务器每个均不停地以不久于5min的时间间隔备份所述需求信息服务器和所述供货信息服务器的新增信息;
任意一个所述区域需求服务器和任意一个所述区域供货服务器以以下两种方式安置:全部安置在同一地理位置,或者各自安置在其对应的实际区域范围内;
新共享经济项目自动挖掘分析方法包括以下步骤:
1)准备步骤:确定计算周期A和计算周期B的时长,计算周期B的时长是计算周期A时长的整数倍;利用语义分析引擎软件对原始商品搜索信息的初始批信息以及原始商品搜索信息的初始批信息进行名词的提取,并将所提取的所有名词依据语义的相似度全部生成初始批商品释义集群信息;
将全部初始批商品释义集群信息生成列表,发送给全部专家终端,并要求每一个专家终端均从初始批商品释义集群信息中的每一条返回建议的正式名信息到系统服务器,系统服务器对针对初始批商品释义集群信息中的每一条返回的全部建议的正式名信息各自进行按建议数排序,并将建议数最多的作为正式名命名每一条商品释义集群信息;
确认所述需求信息服务器从前述多个电子商务信息平台都得到了信息接收的授权,并针对每一个电子商务信息平台进行接收商品搜索信息的测试,将测试通过的电子商务信息平台信息送至需求信息服务器预定位置存储;
系统软件平台给所有的专家终端发提示,要求每一个专家终端至少提供一个可信的供货网站地址,所述供货网站地址是一条完整的IP地址或域名地址,系统服务器对针对所有专家终端返回的全部供货网站地址按出现次数排序,针对出现次数超过50-80次的供货网站地址,进行供货信息抓取的测试,并将通过测试的供货网站地址作为初始批供货网站地址,送至供货信息服务器以存储;
选定限定类别,系统软件平台对该选定限定类别建立属词组,从互联网抓取与限定类别有关的商品名称信息,并通过系统软件平台的相似性核实,对该属词组进行填充,直至属词组中的词条数不少于2000条为止;将该属词组送至所属需求信息服务器和供货信息服务器存储;
2)抓取并加工信息步骤:设定起始时间,并从起始时间开始,在第一个计算周期A内进行如下动作:所述需求信息服务器从测试通过的电子商务信息平台接收该计算周期A内发生的原始商品搜索信息,删除搜索本文信息、搜索位置信息、搜索设备名称三项信息不全的原始商品搜索信息并删除搜索文本信息与属词组中任意一个词都不相近的原始商品搜索信息,并针对搜索文本信息搜索其在商品释义服务器内对应的商品释义信息,对对应到商品释义服务器中的某一条商品释义集群信息的,将其记录为加工需求信息XJ,并存储在为该计算周期A所划定的存储位置;对于无法对应商品释义服务器中的任意一条商品释义集群信息的,将其送至第二存储器中的为该计算周期A所划定的存储位置;
所述供货信息服务器从初始批供货网站地址接收该计算周期A内发生的原始供货信息,删除供货品名信息、供货数量信息和供货位置信息三项信息不全的原始供货信息并删除供货品名信息与属词组中任意一个词都不相近的原始供货信息,并针对供货品名信息搜索其在商品释义服务器内对应的商品释义信息,对对应到商品释义服务器中的某一条商品释义集群信息的,将其记录为加工供货信息GJ,并存储在为该计算周期A所划定的存储位置;对于无法对应商品释义服务器中的任意一条商品释义集群信息的,将其送至第三存储器中的为该计算周期A所划定的存储位置;
在第一个计算周期A结束时,进行如下操作:
利用语义分析引擎软件对原第二存储器和第三存储器内的全部信息进行名词的提取,并将所提取的所有名词依据语义的相似度全部生成该计算周期A的商品释义集群信息;将全部该计算周期A的商品释义集群信息生成列表,发送给全部专家终端,并要求每一个专家终端均对该计算周期A的商品释义集群信息中的每一条返回是否确认的信息,并对确认的信息给出建议的正式名信息,反馈到系统服务器,系统服务器对确认数达到或超过QR值的该计算周期A的商品释义集群信息记录,并以建议数最多的正式名命名每一条商品释义集群信息,并将其补充入所述复数个商品释义集群信息,此时清空前述第二存储器和第三存储器;
将所述需求信息服务器中的本计算周期A内记录的所有加工需求信息XJ按照其搜索位置信息的不同,将其发送至N个区域需求服务器中的对应服务器存储;将所述供货信息服务器中的本计算周期A内记录的所有加工供货信息GJ按照其搜索位置信息的不同,将其发送至N个区域供货服务器中的对应服务器存储;
3)共享可能性挖掘步骤:在按照时间顺序不断反复进行步骤(2),实现一个接一个的计算周期A的计算同时,将前述N个区域分为M个区域分组,M是小于N的正整数;每个区域分组中包含一个或多个前述N个区域,前述N个区域需求服务器以及N个区域供货服务器也被分为M个分组;
在每一个计算周期B结束时,进行如下操作:
针对M组中所有分组的区域需求服务器以及区域供货服务器分组进行计算,对于第1-M组中的第i组,i=1,……,M;
分别归总所有本计算周期B内的第i组的所有加工需求信息XJ和所有加工供货信息GJ,如果出现同时满足下列A、B条件的匹配情况:
A)供货品名信息和搜索文本信息属于同一条商品释义集群信息;
B)对于满足条件A的加工需求信息XJ和所有加工供货信息GJ,1-C<Σ供货数量信息/ΣXJ<1+C;C为0.05至0.3之间的常数;
则记录实际匹配发生时的第i组组别信息、商品释义集群信息、实际发生匹配的加工需求信息XJ和所有加工供货信息GJ的匹配状况信息;生成共享项目挖掘条目,待对所有M组中所有分组的区域需求服务器以及区域供货服务器分组进行计算完毕后,将全部的共享项目挖掘条目,生成具备目录、摘要、全文的该计算周期B当期挖掘报告,将其发送至系统服务器的预留位置存储;
4)浏览与管理步骤:在按照时间顺序不断反复进行步骤(2)和(3),不断地在每一个计算周期B结束时形成新的一期挖掘报告;每当新的一期挖掘报告形成时,将其摘要发送至全部的管理终端,并可接受请求全文的阅读请求,收到阅读请求的管理终端同时发出显示信息和声音提示信息,要求进行身份认证;当收到请求的管理终端上获取了身份信息后,传送给系统服务器,经系统软件平台核实数据格式后,传送给认证服务器,用于与预存的管理人员信息组上的信息进行比对,认证成功后,由系统软件平台确认并发送挖掘报告的全文信息给该管理终端。
2.一种如权利要求1所述的一种新共享经济项目自动挖掘分析方法,其特征在于:
所述计算周期A为1个周,所述计算周期B为5个周;
所述QR的值是20-50的任意正整数;
所述C为0.1至0.2之间的常数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科钢研节能科技有限公司,未经中科钢研节能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910200109.2/1.html,转载请声明来源钻瓜专利网。