[发明专利]一种数据转化方法及系统在审
| 申请号: | 202010712304.6 | 申请日: | 2020-07-22 |
| 公开(公告)号: | CN111881250A | 公开(公告)日: | 2020-11-03 |
| 发明(设计)人: | 纪培端 | 申请(专利权)人: | 深圳市维度统计咨询股份有限公司 |
| 主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/332 |
| 代理公司: | 成都鱼爪智云知识产权代理有限公司 51308 | 代理人: | 赵晨宇 |
| 地址: | 518000 广东省深圳市罗湖*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据 转化 方法 系统 | ||
本发明提出了一种数据转化方法及系统,涉及计算机技术领域。一种数据转化方法包括:获取待转化数据和文本数据转化库,将待转化数据进行拆分得到拆分后的待转化数据,将拆分后的待转化数据与文本数据转化库中包含的待匹配数据进行匹配得到初始转化结果,根据转化结果创建索引库,将文本描述保存至索引库中,根据初始转化结果中的不同词语准确程度计算词语匹配得分,并根据初始转化结果中的不同词语关联程度计算关联度得分,根据词语匹配得分与关联度得分计算最终转化评分,根据最终转化评分得到并输出待转化数据的最终转化结果;其能够提高转换效率降低文本数据转换时工作量大且转换效率低的现象。此外本发明还提出了一种数据转化系统。
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种数据转化方法及系统。
背景技术
随着计算机技术的发展,用户越来越多的行为可以通过计算机来实现,如为用户建立对应的文本档案,从而记录用户行为。
传统地,由于记录的用户行为可能会采用不同的名称进行记录,所以在建立文本档案时,会将用户行为中的数据人工转化为通用的数据,这样工作量大且转换效率低。
后台在实现对应列转化为文本的对应关键词(key)时,基本上都是开发人员自己定义,所有的模板实现基本上千篇一律,尤其在模板列比较多的情况下,定义key是很耗时的事情,而且操作繁琐。
发明内容
本发明的目的在于提供一种数据转化方法,其能够提高转换效率降低文本数据转换时工作量大且转换效率低的现象。
本发明的另一目的在于提供一种数据转化系统,其能够运行一种数据转化方法。
本发明的实施例是这样实现的:
第一方面,本申请实施例提供一种数据转化方法,其包括获取待转化数据和文本数据转化库,将待转化数据进行拆分得到拆分后的待转化数据,将拆分后的待转化数据与文本数据转化库中包含的待匹配数据进行匹配得到初始转化结果,根据转化结果创建索引库,将文本描述保存至索引库中,根据初始转化结果中的不同词语准确程度计算词语匹配得分,并根据初始转化结果中的不同词语关联程度计算关联度得分,根据词语匹配得分与关联度得分计算最终转化评分,根据最终转化评分得到并输出待转化数据的最终转化结果。
在本发明的一些实施例中,上述将拆分后的待转化数据与文本数据转化库中包含的待匹配数据进行匹配得到初始转化结果包括获取待转化数据所对应的转化范围,从文本数据转化库中获取转化范围中所包含的详细数据作为待匹配数据,将拆分后的待转化数据与待匹配数据进行匹配得到初始转化结果。
在本发明的一些实施例中,上述根据初始转化结果中的不同词语准确程度计算词语匹配得分包括查询初始转化结果中的词语所对应的第一得分,查询初始转化结果中的词语所对应的匹配范围的第二得分,根据第一得分与第二得分得到初始转化结果的词语匹配得分。
在本发明的一些实施例中,上述根据初始转化结果中的不同词语关联程度计算关联度得分包括,提取初始转化结果中包含的词语,计算不同的词语之间的关联度作为关联度得分。
在本发明的一些实施例中,上述将待转化数据进行拆分得到拆分后的待转化数据包括获取待转化数据的分词逻辑,并根据分词逻辑对待转化数据进行拆分得到分词序列,计算分词序列所对应的拆分正确率,获取与拆分正确率最大的分词序列作为拆分后的待转化数据。
在本发明的一些实施例中,上述根据最终转化评分得到并输出待转化数据的最终转化结果之后,包括获取标准转化评分范围,判断最终转化结果所对应的最终转化评分是否在标准评分范围内,当最终转化结果所对应的最终转化评分未在标准转化评分范围时,则获取更新文本数据转化库的更新指令,根据更新指令对文本数据转化库进行更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市维度统计咨询股份有限公司,未经深圳市维度统计咨询股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010712304.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





