[发明专利]针对目标对象的数据处理方法、装置、介质及电子设备在审
申请号: | 201911351170.3 | 申请日: | 2019-12-24 |
公开(公告)号: | CN113032642A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 杜飞 | 申请(专利权)人: | 医渡云(北京)技术有限公司 |
主分类号: | G06F16/9032 | 分类号: | G06F16/9032 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
地址: | 100191 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 目标 对象 数据处理 方法 装置 介质 电子设备 | ||
本公开提供了一种针对目标对象的数据处理方法、针对目标对象的数据处理装置、计算机可读介质及电子设备,涉及计算机技术领域。该方法包括:根据程序运行日志生成与查询语言对应的文本,并确定出用于表征文本中字符关系的字符结构;遍历字符结构以确定出文本中各数据表之间的映射关系;根据映射关系构建与程序运行日志对应的目标对象相关的有向无环图。本公开中的针对目标对象的数据处理方法能够在一定程度上解决获取到的目标对象相关数据因无序性导致特定领域分析效率较低的问题,通过获取到的目标对象的数据可以构建相关的有向无环图,进而提升目标对象相关数据的有序性,以便在需要对目标对象进行特定领域分析时提升分析效率。
技术领域
本公开涉及计算机技术领域,具体而言,涉及一种针对目标对象的数据处理方法、针对目标对象的数据处理装置、计算机可读介质及电子设备。
背景技术
随着科技的不断发展,人们在互联网上进行活动时服务器可以对其进行数据记录。若需要针对性地对某用户进行特定领域分析,则需要获取特定领域中与其相关的数据。通常情况下,可以通过遍历数据库的方式,采集得到与该用户相关的所有数据。但是,由于通过这种方式获取到的数据数量通常较大且存在无序性,因此,在应用于特定领域的分析时会存在效率较低的问题。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种针对目标对象的数据处理方法、针对目标对象的数据处理装置、计算机可读介质及电子设备,至少在一定程度上解决获取到的目标对象相关数据因无序性导致特定领域分析效率较低的问题,通过获取到的目标对象的数据可以构建相关的有向无环图,进而提升目标对象相关数据的有序性,以便在需要对目标对象进行特定领域分析时提升分析效率。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
本公开的第一方面提供了一种针对目标对象的数据处理方法,包括:
根据程序运行日志生成与查询语言对应的文本,并确定出用于表征文本中字符关系的字符结构;
遍历字符结构以确定出文本中各数据表之间的映射关系;
根据映射关系构建与程序运行日志对应的目标对象相关的有向无环图。
在本公开的一种示例性实施例中,根据程序运行日志生成与查询语言对应的文本,包括:
从程序运行日志中采集查询语言对应的参考文本;
对参考文本进行归一化处理,得到与查询语言对应的文本。
在本公开的一种示例性实施例中,对参考文本进行归一化处理,得到与查询语言对应的文本,包括:
对参考文本进行数据去重,得到第一参考文本;
对第一参考文本进行缺失数据填补,得到第二参考文本;
对第二参考文本进行数据类型归一化,得到查询语言对应的文本。
在本公开的一种示例性实施例中,确定出用于表征文本中字符关系的字符结构,包括:
对文本进行词法分析和语法分析,并结合词法分析结果和语法分析结果生成用于表征文本中字符关系的字符结构;其中,字符结构通过语法树进行表示。
在本公开的一种示例性实施例中,对文本进行词法分析和语法分析,包括:
根据词切分规则将文本切分为多个分词作为词法分析结果;
根据词法分析结果生成状态转换图,并将状态转换图转换为程序代码作为语法分析结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于医渡云(北京)技术有限公司,未经医渡云(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911351170.3/2.html,转载请声明来源钻瓜专利网。