[发明专利]用于选择用以代表表格式信息的方法和系统有效
申请号: | 201410678045.4 | 申请日: | 2014-11-21 |
公开(公告)号: | CN104714931B | 公开(公告)日: | 2019-04-12 |
发明(设计)人: | D·K·比荣;S·N·格拉德;A·皮科维斯基 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/21 | 分类号: | G06F17/21 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅 |
地址: | 美国纽*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 选择 用以 表表 格式 信息 方法 系统 | ||
1.一种用于选择用以代表表格式信息的结构的方法,所述方法包括:
从表格结构的汇集中选择与表格对应的表格结构;
选择表格结构函数,其中所述表格结构函数描述所述表格结构中的单元格配对中的单元格何时应当彼此相似;
选择单元格相似度函数,其中所述单元格相似度函数根据准则来比较所述表格结构中的所述单元格配对中的所述单元格并且输出所述单元格配对包括包含有彼此相似的值的单元格的概率;
根据所述单元格相似度函数来确定所述表格结构中的第一单元格配对中的第一单元格和第二单元格彼此相似的单元格相似概率;
使用所述单元格相似概率来调整所述表格结构代表所述表格的计算的概率;
将所述计算的概率指示为第一模型代表所述表格的概率,其中所述第一模型是所述表格结构和所选择的单元格相似度函数的函数;
将所述计算的概率指示为第二模型代表所述表格的概率,其中所述第二模型是第二表格结构和所选择的单元格相似度函数的函数;
从模型的集合中选择具有较高的计算的概率的模型以形成选择的模型,所述模型的集合包括所述第一模型和所述第二模型。
2.根据权利要求1所述的方法,还包括:
选择与所述表格对应的第二表格结构;
从所述第二表格结构中选择第二单元格配对;
根据所述单元格相似度函数确定所述第二单元格配对中的第一单元格和第二单元格彼此相似的单元格相似概率;
使用所述单元格相似概率调整所述第二表格结构代表所述表格的第二计算的概率;
以及
根据所选择的模型形成对所述表格的解释,其中,所述表格是问答系统(Q&A系统)的语料库的一部分,所述问答系统使用所述解释来回答自然语言问题。
3.根据权利要求2所述的方法,还包括:
将第三计算的概率指示为第三模型代表所述表格的概率,其中所述第三模型是第三表格结构和所选择的单元格相似度函数的函数,其中所述选择从所述模型集的子集中选择,其中所述子集包括其对应的计算的概率超过概率阈值的那些模型。
4.根据权利要求1所述的方法,其中所述调整包括:
在对若干单元格配对计算所述表格结构的平均单元格相似概率时使用所述单元格相似概率。
5.根据权利要求1所述的方法,其中针对所述表格结构中存在的所有单元格配对的集合的子集执行所述选择所述第一单元格配对、所述确定所述单元格相似概率以及所述调整。
6.根据权利要求1所述的方法,其中所述单元格相似度函数中的所述准则要求给定单元格配对中的所述单元格中的所述值的类型相匹配。
7.根据权利要求1所述的方法,其中所述单元格相似度函数中的所述准则要求给定单元格配对中的所述单元格中的值在彼此的范围内。
8.根据权利要求1所述的方法,还包括:
标识所述表格中的超级单元格,其中所述超级单元格包括相邻单元格的集合,其中所述相邻单元格的集合中的第一单元格的内容描述所述相邻单元格的集合中的第二单元格的内容。
9.根据权利要求8所述的方法,其中所述第一单元格配对包括第一超级单元格和第二超级单元格。
10.根据权利要求1所述的方法,还包括:
标识在所述表格中的行首单元格的集合;以及
标识在所述表格中的列首单元格的集合。
11.根据权利要求10所述的方法,其中所述第一单元格配对包括在所述表格中的第一行首单元格和第二行首单元格。
12.根据权利要求10所述的方法,其中所述第一单元格配对包括在所述表格中的第一列首单元格和第二列首单元格。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410678045.4/1.html,转载请声明来源钻瓜专利网。