[发明专利]自然语言处理、查询构建和分类有效
申请号: | 201910118726.8 | 申请日: | 2019-02-18 |
公开(公告)号: | CN110197192B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | S·A·万德斯多克特;S·B·方;S·利恩彻;J·L·沙尔佩三世;R·P·阿考尔卡尔;B·E·贝斯塞尔;M·J·昌彻拉尼 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F16/36;G06F18/24;G06F40/40 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 吴信刚 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自然语言 处理 查询 构建 分类 | ||
本发明涉及自然语言处理、查询构建和分类。一种系统、计算机程序产品和方法利用分类法服务来格式化地面实况数据。人工智能平台处理地面实况数据,包括识别一个或多个可应用的分类法标签。对所识别的标签进行过滤并将其应用于地面实况数据,从而构建输出字符串,该输出字符串将地面实况数据与一个或多个所识别的标签合并在一起,有效地变换地面实况数据。应用变换的地面实况数据来准确地识别自然语言的来源和/或含义,并且在一个实施例中,用于产生物理硬件设备的物理动作或变换。
技术领域
本实施例涉及自然语言处理。更具体地,实施例涉及用于利用相关联的分类法(taxonomy)分类来增强数据的人工智能平台。
背景技术
在人工智能计算机系统领域,自然语言系统(例如IBM WatsonTM人工智能计算机系统和其他自然语言问答系统)基于由系统获取的知识来处理自然语言。为了处理自然语言,可以使用从数据库或知识语料库获得的数据来训练系统,但是由于与语言构造和人类推理的特性相关的各种原因,所得到的结果可能是不正确的或不准确的。
机器学习是人工智能(AI)的子集,其利用算法从数据中学习并基于该数据产生预见。AI指的是机器基于信息能够做出决策从而最大化在给定主题中成功的机会的智能。更具体地,AI能够从数据集中学习以解决问题并提供相关推荐。AI是认知计算的子集,它指的是大规模地学习、有目的地推理且自然地与人类交互的系统。认知计算是计算机科学和认知科学的混合体。认知计算利用自我教学算法,其使用数据最小值、视觉识别和自然语言处理来解决问题和优化人类处理。
认知系统本质上是非确定性的。具体而言,从认知系统输出的数据易受所提供的信息的影响并用作输入。例如,当部署新的机器学习模型时,不能保证系统将提取与先前相同的实体。新模型可能会对先前模型结果产生不利影响。类似地,通过文档引入的错误可能导致提取不正确的数据并提供不正确的数据作为输出。因此,需要在认知系统中创建确定性行为。
发明内容
实施例包括用于针对认知系统的确定性数据的自然语言处理的系统、计算机程序产品和方法。
在一个方面,提供了一种计算机系统,其具有可操作地耦接到存储器的处理单元、以及与处理单元通信的人工智能平台。知识引擎被设置为与处理单元通信,并且用于通过人工智能平台变换地面实况(ground truth,GT)数据。更具体地,知识引擎构建训练模块以识别与GT数据的本体路径相关的一个或多个分类法标签,并执行构建的训练模块。该执行将识别的分类法标签应用于GT,其包括将识别的标签附加到GT末端。另外,知识引擎以GT的字符串的形式构建查询,其中一个或多个所识别的分类法标签被附加到字符串前端。该查询包括至少一个同义词集和GT数据的本体路径的直接上位词。
在另一方面,提供了一种用于处理自然语言(NL)的计算机程序设备。该计算机程序产品包括具有与其一起实现的程序代码的计算机可读存储设备。程序代码可由处理单元执行来通过人工智能平台变换地面实况(GT)数据。变换包括程序代码,以构建训练模块来识别与GT数据的本体路径相关的一个或多个分类法标签,并执行构建的训练模块来将识别的分类法标签应用于GT,其包括将识别的标签附加到GT末端。进一步提供程序代码以便以创建GT的字符串的形式构建查询,其中一个或多个所识别的分类法标签被附加到字符串前端。该查询包括至少一个同义词集和GT数据的本体路径的直接上位词。
在又一方面,提供了一种用于处理自然语言的方法,包括通过人工智能平台变换地面实况(GT)数据。构建训练模块以识别与GT数据的本体路径相关的一个或多个分类法标签。执行训练模块,其中执行包括将识别的分类法标签应用到GT,其进一步包括将识别的标签附加到GT末端。利用训练模块构建查询。该查询包括GT的字符串,其中一个或多个所识别的分类法标签被附加到该字符串前端。更具体地,该查询包括至少一个同义词集和GT数据的本体路径的直接上位词。
从以下结合附图对当前优选实施例的详细描述中,这些和其他特征和优点将变得显而易见。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910118726.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电子游戏推荐方法
- 下一篇:一种多参数流式数据自动分群方法