[发明专利]分类文本以确定用于选择机器学习算法结果的目标类型在审

专利信息
申请号: 201910294022.6 申请日: 2019-04-12
公开(公告)号: CN110532376A 公开(公告)日: 2019-12-03
发明(设计)人: A·E·卡恩;D·孔特雷拉斯;B·德利玛;C·O·艾伦 申请(专利权)人: 国际商业机器公司
主分类号: G06F16/35 分类号: G06F16/35;G06F17/27
代理公司: 11256 北京市金杜律师事务所 代理人: 酆迅;辛鸣<国际申请>=<国际公布>=<
地址: 美国纽*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 机器学习算法 文本 目标类型 计算机程序产品 自然语言处理 性能测量 分类器 分类 确定性 测量
【说明书】:

提供了一种用于对文本进行分类以确定用于选择机器学习算法结果的目标类型的计算机程序产品、系统和方法。执行文本的自然语言处理以确定文本中的特征及其关系。分类器基于关系和特征对文本进行分类以确定目标类型。将来自文本的所确定的特征和关系输入到多个不同的机器学习算法中以生成结果。对于每个机器学习算法,确定由生成结果的机器学习算法产生的性能测量。确定性能测量与所确定的目标类型高度相关的至少一个机器学习算法。从至少一个结果中确定结果。

技术领域

发明涉及用于对文本进行分类以确定用于选择机器学习算法结果的目标类型的计算机程序产品、系统和方法。

背景技术

可以训练机器学习程序以基于输入文本产生结果。例如,可以使用自然语言处理来处理医疗记录中的文本以检测与身体状况相关的单词,然后将这些单词输入到机器学习算法中以基于文本中(诸如电子病历中)的检测到的身体状况对医学诊断进行分类。在集成学习中,可以使用多个机器学习模型对来自输入文本的结果进行分类,以改善预测结果,从而减少方差、偏差和改进预测。

本领域需要改进的技术来使用机器学习算法的集合来确定来自输入的预测结果。

发明内容

提供了一种用于对文本进行分类以确定用于选择机器学习算法结果的目标类型的计算机程序产品、系统和方法。执行文本的自然语言处理以确定文本中的特征及其关系。分类器基于关系和文本的特征对文本进行分类以确定多个目标类型中的目标类型。将来自文本的所确定的特征和关系输入到多个不同的机器学习算法中以生成文本的结果。对于每个机器学习算法,确定由生成结果的机器学习算法产生的性能测量。确定机器学习算法中性能测量与所确定的目标类型高度相关的至少一个机器学习算法。从所确定的至少一个机器学习算法的至少一个结果中确定结果。

附图说明

图1示出了计算设备的实施例;

图2示出了提供关于从输入文本分类的目标的信息的目标类型的实施例;

图3示出了由机器学习算法产生的机器学习输出的实施例;

图4a和4b示出了从输入文本确定目标类型的操作的实施例;

图5示出了使用所确定的目标类型来确定来自机器学习算法的结果的操作的实施例;以及

图6示出了图1的组件可以在其中实现的计算环境。

具体实施方式

在机器学习算法的集合中,使用多个模型来从输入文本或其他输入数据生成结果。然而,理解不同的分类器或机器学习算法是否最适合于正在处理的输入文本的类型需要深入了解每个机器学习算法如何工作,并且特定领域的这种专业知识可能无法获取。为了在不同的机器学习算法中进行选择以在特定上下文中使用,需要理解用于生成结果和基础数据的机器学习算法。

所描述的实施例通过提供计算机技术来改进用于机器学习处理的计算机技术,以改进从算法集合中选择用于提供输入文本的结果的机器学习算法。所描述的实施例使用分类器来基于在文本中确定的关系和特征对文本进行分类以确定文本的目标类型。输入文本的特征和关系被输入到机器学习算法,该算法产生结果以及性能测量。确定性能测量具有与所确定的目标类型最高度相关的至少一个机器学习算法,使得可以选择来自与输入文本的目标类型最相关的所确定的至少一个机器学习算法的结果。

利用所描述的实施例,自动从学习算法集合中选择机器学习算法以基于输入文本的目标类型或标准以及机器学习算法的性能测量来提供结果。以这种方式,实现了机器学习算法的更优选择,因为选择来自性能测量与如由分类器算法确定的输入文本的所确定的目标类型最相关的那些机器学习算法的结果,该分类器算法对文本的目标或标准进行分类,诸如问题的范围、问题需要准确度、精确度还是召回,即大量答案。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910294022.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top