[发明专利]一种提取实例模板的方法和设备有效
申请号: | 201610390418.7 | 申请日: | 2016-06-02 |
公开(公告)号: | CN107463549B | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 史黎鑫;张海波;卞华明;管陶然;刘禹;赵宇;骆卫华;林锋 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 任嘉文 |
地址: | 英属开曼群岛大开曼*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请涉及计算机技术领域,特别涉及一种提取实例模板的方法和设备,用以解决现有技术在提取过程中产生大量价值较低的模板,造成实例模板库中模板存储的信息冗余的问题。本申请实施例将所有原始语料实例划分为多组;针对多组原始语料实例中的一组原始语料实例中的一个原始语料实例,确定原始语料实例中的变量集合,并根据变量集合确定原始语料实例对应的备选模板;针对多组原始语料实例中的一组原始语料实例,从原始语料实例对应的备选模板中提取实例模板。由于本申请实施例确定原始语料实例中所有变量集合,增大对备选模板的召回数量;并且从原始语料实例对应的备选模板中提取出实例模板,从而保证提取出的实例模板的质量更高。 | ||
搜索关键词: | 一种 提取 实例 模板 方法 设备 | ||
【主权项】:
一种提取实例模板的方法,其特征在于,该方法包括:根据原始语料实例之间的相似度,将所述原始语料实例划分为多组;针对所述多组中的一组原始语料实例中的任意一个原始语料实例:确定所述任意一个原始语料实例中的变量集合;根据所述变量集合,确定所述任意一个原始语料实例对应的备选模板;针对所述多组中的一组原始语料实例,从所述原始语料实例对应的备选模板中提取实例模板。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610390418.7/,转载请声明来源钻瓜专利网。