[发明专利]行业分类方法、装置、系统及计算机可读存储介质在审
申请号: | 202110040343.0 | 申请日: | 2021-01-12 |
公开(公告)号: | CN112765349A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 李勇;陈婷;吴三平;王宗泽 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06F40/216;G06Q10/06 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 张志江 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行业 分类 方法 装置 系统 计算机 可读 存储 介质 | ||
本发明公开了一种行业分类方法,包括:获取待分类对象的交易数据,并对所述交易数据进行提取处理,得到对应的提取信息;根据所述提取信息,确定所述待分类对象的目标行业。本发明还公开了一种行业分类装置、系统及计算机可读存储介质。本发明通过对待分类对象的交易数据进行提取处理,从而确定待分类对象的目标行业,替代传统上通过人工进行行业分类的方式,提高行业分类的效率。
技术领域
本发明涉及数据处理技术领域,尤其涉及行业分类方法、装置、系统及计算机可读存储介质。
背景技术
对待分类对象进行行业分类,可解释该待分类对象对应的行业现在的发展阶段及其在国民经济中的地位,可分析影响行业发展的各种因素以及判断行业的影响力度,可预测并引导行业的未来发展趋势,可判断行业的投资价值,揭示行业风向,为各组织机构提供投资决策或投资依据。
现有的技术方案大多是通过人工分类的方式来解决待分类对象的行业分类问题,需要耗费大量人力,导致行业分类的效率低。
发明内容
本发明的主要目的在于提出一种行业分类方法、装置、系统及计算机可读存储介质,旨在提高行业分类的效率。
为实现上述目的,本发明提供一种行业分类方法,所述方法包括如下步骤:
获取待分类对象的交易数据,并对所述交易数据进行提取处理,得到对应的提取信息;
根据所述提取信息,确定所述待分类对象的目标行业。
优选地,所述根据所述提取信息,确定所述待分类对象的目标行业的步骤包括:
当所述提取信息包含所述待分类对象的名称时,对所述名称进行分词处理,得到所述待分类对象的名称分词;
判断所述名称分词中是否包含所述待分类对象的行业分词;
若包含,则根据所述行业分词,确定所述待分类对象的第一待定行业,并根据所述第一待定行业,确定所述待分类对象的目标行业。
优选地,所述第一待定行业至少包括两个行业,所述根据所述第一待定行业,确定所述待分类对象的目标行业的步骤包括:
获取预设行业优先级,并根据所述预设行业优先级,从所述第一待定行业中确定行业优先级最高的第二待定行业;
当所述第二待定行业只包括一个行业时,则确定所述第二待定行业为所述待分类对象的目标行业。
优选地,述从所述第一待定行业中确定行业优先级最高的第二待定行业的步骤之后,还包括:
当所述第二待定行业至少包括两个行业时,获取各所述第二待定行业对应的行业分词的输出词序,将所述输出词序映射为所述待分类对象的行业时序;
根据所述行业时序,从所述第二待定行业中确定所述待分类对象的目标行业。
优选地,所述根据所述行业时序,从所述第二待定行业中确定所述待分类对象的目标行业的步骤包括:
根据预设时序规则和所述行业时序,从所述第二待定行业中确定所述待分类对象的第四待定行业;
当所述第四待定行业至少包括两个行业时,则从所述待分类对象的提取信息中获取交易特征信息,并根据所述交易特征信息,确定各所述第四待定行业对应的行业概率;
根据所述行业概率,确定所述待分类对象的目标行业。
优选地,所述根据所述提取信息,确定所述待分类对象的目标行业的步骤的步骤包括:
当所述提取信息包含所述待分类对象的交易特征信息时,根据所述交易特征信息构建所述待分类对象所属行业的行业概率;
根据所述行业概率,确定所述待分类对象的目标行业。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110040343.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种胸外科上药器
- 下一篇:一种抵消电磁场的电芯、软包锂电池及其制作方法