[发明专利]一种提供自然语言处理服务的系统及方法在审
申请号: | 201910923908.2 | 申请日: | 2019-09-27 |
公开(公告)号: | CN110705271A | 公开(公告)日: | 2020-01-17 |
发明(设计)人: | 林廷懋;钟伊妮;郭泽颖;柯颖;陈铭新;李晓敦;赵世辉 | 申请(专利权)人: | 中国建设银行股份有限公司;建信金融科技有限责任公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/58 |
代理公司: | 11219 中原信达知识产权代理有限责任公司 | 代理人: | 王志远;陈继越 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自然语言处理 标注 数据平台 训练平台 应用平台 自然语言处理技术 服务日志 数据存储 文本提供 用户提供 服务 标签 存储 文本 统一 | ||
本发明公开了一种提供自然语言处理服务的系统及方法,涉及自然语言处理技术领域。该系统一具体实施方式包括:标注平台、训练平台、自然语言处理应用平台、数据平台;所述标注平台,用于将标注后的数据存储至所述数据平台;所述训练平台,用于对所述标注后的数据进行训练用以生成自然语言处理模型;所述自然语言处理应用平台,用于使用所述自然语言处理模型对待识别文本提供标签,将生成的含有所述待识别文本的服务日志存储至所述数据平台,以使得所述标注平台从所述服务日中获取新的待标注的数据。该实施方式可以源源不断地扩充待标注的数据,进而为用户提供持续的自然语言处理服务。
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种提供自然语言处理服务的系统及方法。
背景技术
自然语言处理(NLP,Natural Language Processing)技术在实际落地中一直存在标注数据少、业务场景多、业务场景经常调整等诸多问题。因而如何解决实际落地及应用过程中的业务知识积累,并将这些知识积累持续用于提升基于现有的少量的先验知识获取的自然语言处理模型成为了研究的重点。
目前,虽已出现了基于SAAS(Software-as-a-Service,软件即服务)提供自然语言处理服务的解决方案,即通过网络提供软件服务,但仍不能满足为用户提供持续、高质量的自然语言处理服务的需要。
发明内容
有鉴于此,本发明提供一种提供自然语言处理服务的系统及方法,能够在为用户提供自然语言处理服务的同时,基于提供自然语言处理服务时产生的含有待识别文本的服务日志,不断获取新的待标注数据或训练数据,进而不断提升或改进训练得到的自然语言处理模型,从而为用户提供持续、高质量的自然语言处理服务。
为实现上述目的,根据本发明的一个方面,提供了一种提供自然语言处理服务的系统,包括:标注平台、训练平台、自然语言处理应用平台、数据平台;其中,所述标注平台,用于从所述数据平台中获取待标注的数据,对所述待标注的数据进行标注,并将标注后的数据存储至所述数据平台;所述训练平台,用于从所述数据平台获取所述标注后的数据,对所述标注后的数据进行训练用以生成自然语言处理模型,并将所述自然语言处理模型存储至所述数据平台;所述自然语言处理应用平台,用于从所述数据平台中获取所述自然语言处理模型,使用所述自然语言处理模型对待识别文本提供标签,将生成的含有所述待识别文本的服务日志存储至所述数据平台,以使得所述标注平台从所述服务日中获取新的待标注的数据;所述数据平台,用于存储所述待标注的数据、所述标注后的数据、所述自然语言处理模型、所述服务日志。
可选地,所述自然语言处理应用平台,用于接收模型调用方的自然语言处理任务,所述自然语言处理任务指示了所述待识别文本。
可选地,所述自然语言处理应用平台用于将所述待识别文本对应的标签发送至所述模型调用方,并接收所述模型调用方校准后的所述待识别文本对应的标签。
可选地,所述训练平台使用校准后的标签评估以及优化所述自然语言处理模型。
可选地,所述自然语言处理模型具有模型标识,用于生成所述自然语言处理模型的所述待标注数据具有标注任务标识;相对应地存储所述模型标识、所述标注任务标识、所述待识别文本和所述标签。
为实现上述目的,根据本发明的另一个方面,提供了一种提供自然语言处理服务的方法,包括:从数据平台中获取待标注的数据,对待标注的数据进行标注,并将标注后的数据存储至所述数据平台;从所述数据平台中获取所述标注后的数据,对所述标注后的数据进行训练用以生成自然语言处理模型,并将所述自然语言处理模型存储至所述数据平台;从所述数据平台中获取所述自然语言处理服务模型对应的文件,根据所述自然语言处理服务模型,使用所述自然语言处理模型对待识别文本提供标签,将生成的含有所述待识别文本的服务日志存储至所述数据平台,以从所述服务日志中获取新的待标注的数据。
可选地,接收模型调用方的自然语言处理任务,所述自然语言处理任务指示了所述待识别文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司;建信金融科技有限责任公司,未经中国建设银行股份有限公司;建信金融科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910923908.2/2.html,转载请声明来源钻瓜专利网。