[发明专利]使用神经网络编码器的结构数据匹配在审
申请号: | 201811148169.6 | 申请日: | 2018-09-29 |
公开(公告)号: | CN110309192A | 公开(公告)日: | 2019-10-08 |
发明(设计)人: | R.尚穆加马尼;J.张 | 申请(专利权)人: | SAP欧洲公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
地址: | 德国瓦*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多维向量 数据集 编码数据 第一数据 编码器 损失函数 计算机可读存储介质 结构化数据 结构数据 匹配数据 神经网络 输出表示 输出 匹配 | ||
本公开的实施方式包括用于接收第一和第二数据集的方法、系统和计算机可读存储介质,第一和第二数据集包括多个列中的结构化数据,对于第一数据集和第二数据集的每个,将每列输入到特定于相应列的列类型的编码器中,编码器分别提供用于第一数据集和第二数据集的编码数据,基于第一数据集的编码数据提供第一多维向量,基于第二数据集的编码数据提供第二多维向量,并将第一多维向量和第二多维向量输出到损失函数,该损失函数处理第一多维向量和第二多维向量以提供输出,该输出表示第一和第二数据集之间的匹配数据点。
技术领域
本发明涉及一种使用神经网络编码器的结构数据匹配。
背景技术
数据库系统可以存储大量数据集。在某些情况下,数据集可以是相关的。在示例上下文中,第一数据集可以表示计算机系统性能,第二数据集可以表示响应于计算机系统性能而生成的信息技术(IT)警报。数据集之间的匹配数据可用于关联数据集,并匹配类似的数据项。特别地,数据匹配可以包括确定查询数据点(例如,计算机系统性能)与目标数据点(例如,IT警报)之间的关联。
数据匹配的传统方法可以包括基于规则的方法,其提供定义要匹配的数据值的一组规则。然而,这种传统系统可能是资源效率低下的,并且不能提供准确或清晰的结果。例如,对于查询数据点,传统方法可以提供候选目标数据点的排序列表,而不是精确匹配。因此,如果甚至存在于排序列表中,则可能需要花费额外的资源和时间来从排序列表中识别完全匹配。
发明内容
本公开的实施方式包括用于数据匹配结构化数据集的计算机实现的方法。更具体地,本公开的实施方式针对使用深度学习的结构化数据集之间的数据匹配问题。
在一些实施方式中,动作包括接收第一数据集和第二数据集,第一数据集和第二数据集包括多个列中的结构化数据,对于第一数据集和第二数据集的每一个,将每列输入到特定于相应列的列类型的编码器中,编码器分别提供用于第一数据集和第二数据集的编码数据,基于第一数据集的编码数据提供第一多维向量,基于第二数据集的编码数据提供第二多维向量,并将第一多维向量和第二多维向量输出到损失函数,该损失函数处理第一多维向量和第二多维向量以提供输出,该输出表示第一数据集和第二数据集之间的匹配数据点。其他实施方式包括相应的系统、装置和计算机程序,被配置为执行编码在计算机存储设备上的方法的动作。
这些和其他实施方式可以各自可选地包括以下特征中的一个或多个:相同的编码器用于提供第一数据集的编码数据和第二数据集的编码数据;在编码器提供编码数据之前,预处理第一数据集和第二数据集中的一个或多个的数据值以提供修正的数据值;预处理包括将一个或多个零预附加到数值数据值;预处理包括将一个或多个空格预附加到串数据值;动作还包括在提供编码数据之前从第一数据集和第二数据集中的每一个过滤至少一列;并且动作还包括确定多个列中的每列的列类型。
本公开还提供了一个或多个非暂时性计算机可读存储介质,其耦合到一个或多个处理器并且具有存储在其上的指令,当由一个或多个处理器执行时,所述指令使得一个或多个处理器根据本文提供的方法的实施方式执行操作。
本公开还提供了一种用于实现本文提供的方法的系统。该系统包括一个或多个处理器,以及耦合到一个或多个处理器的计算机可读存储介质,其上存储有指令,当由一个或多个处理器执行时,使得一个或多个处理器根据本文提供的方法的实施方式执行操作。
应了解,根据本公开的方法可包括本文描述的方面和特征的任何组合。也就是说,根据本公开的方法不限于本文具体描述的方面和特征的组合,还包括所提供的方面和特征的任何组合。
在附图和以下描述中阐述了本公开的一个或多个实施方式的细节。根据说明书和附图以及权利要求,本公开的其他特征和优点将显而易见。
附图说明
图1描绘了可用于执行本公开的实施方式的示例环境。
图2描绘了根据本公开的实施方式的示例数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于SAP欧洲公司,未经SAP欧洲公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811148169.6/2.html,转载请声明来源钻瓜专利网。