[发明专利]一种人机对话系统的文本分类方法在审
| 申请号: | 201910802162.X | 申请日: | 2019-08-28 |
| 公开(公告)号: | CN110516041A | 公开(公告)日: | 2019-11-29 |
| 发明(设计)人: | 吴龙飞;孙艺斌 | 申请(专利权)人: | 深圳勇艺达机器人有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F16/35;G06F17/27;G06K9/62 |
| 代理公司: | 11544 北京金蓄专利代理有限公司 | 代理人: | 刘立义<国际申请>=<国际公布>=<进入 |
| 地址: | 518000 广东省深圳市宝安区航城街道*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 预测模型 大类 人机对话系统 模型训练 模型预测 文本分类 预测结果 二分类 数据库 机器学习算法 用户语音识别 数据库训练 人机对话 文本文本 实时性 预测 | ||
本发明公开了一种人机对话系统的文本分类方法,包括模型训练和模型预测两部分:模型训练为在包含了数十至数百个不同领域的数据库的人机对话系统中,使用全部数据库训练二分类预测模型Ma,把不同领域的数据库平均分成两大类,分别训练得到第一大类内各个类的第一类预测模型Mb和第二大类内各个类的第二类预测模型Mc;模型预测为对用户语音识别后的文本文本使用二分类预测模型Ma进行预测,得出预测结果,如果结果属于第一类预测模型Mb,则使用第一类预测模型Mb进行预测,判断预测结果得分是否大于阈值,以选取具体预测模型。解决了现有机器学习算法在人机对话领域对文本分类的准确性和实时性不佳的问题。
技术领域
本发明涉及一种人机对话文本训练方法,具体涉及一种人机对话系统的文本分类方法。
背景技术
近年来,随着人工智能技术的飞速发展,人机对话系统作为人工智能领域的核心技术之一,在提高人与机器沟通效率的同时,也极大地方便了人们的生活和工作。如何有效的获取用户的说话意图是人机对话的关键技术。
由于自然语言的复杂性和多样性,人机对话系统中往往包含数十甚至上百个领域,利用机器学习方法对如此多的领域进行分类时,分类的准确性和训练分类模型所需的时间都不太理想。
现有的机器学习分类算法,在文本语料不变的情况下,分类的数量与训练分类模型所需的时间是成正相关的,也就是分类数越多,训练分类模型所需要的时间也越长。在人机对话系统中,由于需要用到的领域较多,对大量不同领域的文本语料进行分类时,则需要十几个小时甚至数天时间,对于模型的调试和系统的迭代更新产生了严重的阻碍。
所以,需要对机器学习文本分类方法进行优化,以更好应用于人机对话系统,获得更好的使用效果和更佳的实用性。
发明内容
本发明的目的在于提供一种人机对话系统的文本分类方法,用以解决现有机器学习算法在人机对话领域对文本分类的准确性和实时性不佳的问题。
为实现上述目的,本发明采用如下技术方案:
一种人机对话系统的文本分类方法,所述分类方法包括模型训练和模型预测两部分:
所述模型训练为在包含了数十至数百个不同领域的数据库的人机对话系统中,使用全部数据库训练二分类预测模型Ma,把不同领域的数据库平均分成两大类,训练两大类内各个类的预测模型,得到第一大类内各个类的第一类预测模型Mb和第二大类内各个类的第二类预测模型Mc;
所述模型预测为对用户语音识别后的文本文本使用二分类预测模型Ma进行预测,得出预测结果,如果结果属于第一类预测模型Mb,则使用第一类预测模型Mb进行预测,判断预测结果得分是否大于阈值,若得分大于阈值则使用第一类预测模型Mb预测的结果,否则使用第二类预测模型Mc进行预测,若结果大于阈值则使用第二类预测模型Mc预测的结果,否则取第一类预测模型Mb和第二类预测模型Mc中得分高的作为预测结果;
所述模型预测为对用户语音识别后的文本文本使用二分类预测模型Ma进行预测,得出预测结果,如果结果属于第二类预测模型Mc,则使用第二类预测模型Mc进行预测,判断预测结果得分是否大于阈值,若得分大于阈值则使用第二类预测模型Mc预测的结果,否则使用第一类预测模型Mb进行预测,若结果大于阈值则使用第一类预测模型Mb预测的结果,否则取第一类预测模型Mb和第二类预测模型Mc中得分高的作为预测结果。
优选的,上述阈值为经验值,在实际产品中由设计人员以多次试验的办法测试得出。
优选的,上述模型训练中对不同领域的数据库平均分成两大类的过程为:先将数据库依次编号,对编号取中间值,第一个数据库到中间值归为第一类,中间值后至最后一个数据库为第二类。
优选的,上述模型训练中对不同领域的数据库平均分成两大类的过程为:先将数据库依次编号,对编号为偶数的归为第一类,对编号为奇数的归为第二类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳勇艺达机器人有限公司,未经深圳勇艺达机器人有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910802162.X/2.html,转载请声明来源钻瓜专利网。





