[发明专利]一种通过分词形式规范企业名称的方法在审
申请号: | 201710452716.9 | 申请日: | 2017-06-15 |
公开(公告)号: | CN107341144A | 公开(公告)日: | 2017-11-10 |
发明(设计)人: | 于滨 | 申请(专利权)人: | 云程科技股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 250000 山东省济南市高新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种通过分词形式规范企业名称的方法,根据销售记录中的企业名称的中文词库,将其中文词库中客户的名称信息归纳定义为12类词性,通过这12类的词性,对记录中的客户名称进行分词处理,具体实现步骤如下接收企业名称,企业名称标准化,企业名称分词,输出分词后的企业名称。本发明可以通过对企业客户信息中杂乱不规范的客户信息进行筛分处理,能将录入的客户信息根据地区、公司性质、行业特点等进行自动分类标示,方便统计和调用,减少了大量的人工清洗名称的工作,对企业后期统计分析及企业决策提供很好的便利性。 | ||
搜索关键词: | 一种 通过 分词 形式 规范 企业名称 方法 | ||
【主权项】:
一种通过分词形式规范企业名称的方法,其特征在于:根据销售记录中的企业名称的中文词库,将其中文词库中客户的名称信息归纳定义为12类词性,通过这12类的词性,对记录中的客户名称进行分词处理,具体实现步骤如下:一、接收企业名称:接收需要处理的企业名称;二、企业名称标准化:对企业名称格式进行规范化处理,依次包括名称乱码处理、附加信息清除处理、符号处理、数字转义处理、语义转化处理和输出规范名称处理步骤;三、企业名称分词:对名称进行分词处理,包括传入第二步输出的企业规范名称、标准省市识别、标准单词处理、清理冗余词语、数字信息识别、终端嵌套处理和生成分词步骤;四、输出分词后的企业名称:输出结果进行汇总、比对。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云程科技股份有限公司,未经云程科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710452716.9/,转载请声明来源钻瓜专利网。