[发明专利]一种会话意图智能识别模型的构建方法、装置及设备在审
| 申请号: | 202010968430.8 | 申请日: | 2020-09-15 | 
| 公开(公告)号: | CN112131890A | 公开(公告)日: | 2020-12-25 | 
| 发明(设计)人: | 周鹏飞;马亮 | 申请(专利权)人: | 北京慧辰资道资讯股份有限公司 | 
| 主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F16/332;G06F16/33;G06F16/35;G06N3/04;G06N3/08 | 
| 代理公司: | 北京壹川鸣知识产权代理事务所(特殊普通合伙) 11765 | 代理人: | 林潮 | 
| 地址: | 100089 北京市海淀*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 会话 意图 智能 识别 模型 构建 方法 装置 设备 | ||
本发明适用大数据人工智能技术领域,提供会话意图智能识别模型的构建方法、装置及设备,包括:获取语料数据,所述语料数据包括已标注语料数据以及未标注语料数据;根据已标注语料数据以及预设的语义分析算法,对未标注语料数据进行处理,生成有标签信息的意图语料数据;根据意图语料数据,对预设的初始意图识别模型进行迭代训练,构建目标意图识别模型。本发明利用大量无标注语料数据,基于预设的语义分析算法,实现训练语料半自动标注,仅需少量纠正即可完成大规模语料标注过程,降低语料标注成本;另外,将语料标注、模型优化问题作为一个统一任务进行迭代,实现意图识别模型生成过程中人工干预最小化、解决数据标注耗时、模型训练困难的问题。
技术领域
本发明属于大数据人工智能技术领域,尤其涉及一种会话意图智能识别模型的构建方法、装置及设备。
背景技术
随着社会信息化、智能化不断发展,基于自然语言理解的智能客服、智能助手、聊天机器人等智能会话应用开始广泛使用。意图识别模型在人机交互会话中,分析用户输入信息、确认用户交互意图,是此类应用的核心组件,意图识别模型的优劣对应用智能化程度和用户体验水平具有决定性影响。
目前意图识别模型,主要为有监督方式训练,需要标注大量语料,而此类应用一般面向海量互联网用户,用户意图复杂繁多且容易随着时间而变化。现有意图识别模型构建过程主要包括语料标注和模型训练两个过程,其中,语料标注、意图修改需要花费大量人力和时间,如何快速、高效、低成本地构建意图识别模型一直是此类应用建设中的关键点。现有意图识别模型构建方法主要有:采用人工标注方式对领域文本数据集进行标注,之后进行模型训练;或者通过聚类方法进行意图发现及意图语料收集,但大规模的业务数据从不同角度理解能够得到不同的主题类别,聚类发现的主题往往并非业务所需要的,该方法远远无法满足实际业务需求;或者通过模型预测结果作为指导,利用大量用户选择数据生成训练样本,但该方法使用标准样本训练初始预测模型,而标准样本依赖人工标注获取,该方法没有解决标准样本的标注问题,在无法获取用户反馈时无法利用。
由此可见,现有的意图识别模型构建方法存在需要大量人工干预、数据标注耗时多以及模型训练困难的问题。
发明内容
本发明实施例的目的在于提供一种会话意图智能识别模型的构建方法,旨在解决现有的意图识别模型构建方法存在需要人工大量干预、数据标注耗时多以及模型训练困难的问题。
本发明实施例是这样实现的,一种会话意图智能识别模型的构建方法,包括:
获取语料数据,所述语料数据包括已标注语料数据以及未标注语料数据;
根据所述已标注语料数据以及预设的语义分析算法,对所述未标注语料数据进行处理,生成有标签信息的意图语料数据;
根据所述意图语料数据,对预设的初始意图识别模型进行迭代训练,构建目标意图识别模型;所述初始意图识别模型是通过所述已标注语料数据经神经网络训练生成;
判断所述迭代训练是否满足预设的迭代结束条件;若否,则返回所述获取语料数据的步骤;若是,则迭代训练结束。
本发明实施例的另一目的在于一种会话意图智能识别模型的构建装置,包括:
语料数据获取单元,用于获取语料数据,所述语料数据包括已标注语料数据以及未标注语料数据;
意图语料数据生成单元,用于根据所述已标注语料数据以及预设的语义分析算法,对所述未标注语料数据进行处理,生成有标签信息的意图语料数据;
迭代训练单元,用于根据所述意图语料数据,对预设的初始意图识别模型进行迭代训练,构建目标意图识别模型;所述初始意图识别模型是通过所述已标注语料数据经神经网络训练生成;以及
判断单元,用于判断所述迭代训练是否满足预设的迭代结束条件;若否,则返回所述获取语料数据的步骤;若是,则迭代训练结束。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京慧辰资道资讯股份有限公司,未经北京慧辰资道资讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010968430.8/2.html,转载请声明来源钻瓜专利网。





