[发明专利]一种人机对话系统的文本分类方法在审
| 申请号: | 201910802162.X | 申请日: | 2019-08-28 |
| 公开(公告)号: | CN110516041A | 公开(公告)日: | 2019-11-29 |
| 发明(设计)人: | 吴龙飞;孙艺斌 | 申请(专利权)人: | 深圳勇艺达机器人有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F16/35;G06F17/27;G06K9/62 |
| 代理公司: | 11544 北京金蓄专利代理有限公司 | 代理人: | 刘立义<国际申请>=<国际公布>=<进入 |
| 地址: | 518000 广东省深圳市宝安区航城街道*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种人机对话系统的文本分类方法,包括模型训练和模型预测两部分:模型训练为在包含了数十至数百个不同领域的数据库的人机对话系统中,使用全部数据库训练二分类预测模型Ma,把不同领域的数据库平均分成两大类,分别训练得到第一大类内各个类的第一类预测模型Mb和第二大类内各个类的第二类预测模型Mc;模型预测为对用户语音识别后的文本文本使用二分类预测模型Ma进行预测,得出预测结果,如果结果属于第一类预测模型Mb,则使用第一类预测模型Mb进行预测,判断预测结果得分是否大于阈值,以选取具体预测模型。解决了现有机器学习算法在人机对话领域对文本分类的准确性和实时性不佳的问题。 | ||
| 搜索关键词: | 预测模型 大类 人机对话系统 模型训练 模型预测 文本分类 预测结果 二分类 数据库 机器学习算法 用户语音识别 数据库训练 人机对话 文本文本 实时性 预测 | ||
【主权项】:
1.一种人机对话系统的文本分类方法,其特征在于:所述分类方法包括模型训练和模型预测两部分:/n所述模型训练为在包含了数十至数百个不同领域的数据库的人机对话系统中,使用全部数据库训练二分类预测模型(Ma),把不同领域的数据库平均分成两大类,训练两大类内各个类的预测模型,得到第一大类内各个类的第一类预测模型(Mb)和第二大类内各个类的第二类预测模型(Mc);/n所述模型预测为对用户语音识别后的文本文本使用二分类预测模型(Ma)进行预测,得出预测结果,如果结果属于第一类预测模型(Mb),则使用第一类预测模型(Mb)进行预测,判断预测结果得分是否大于阈值,若得分大于阈值则使用第一类预测模型(Mb)预测的结果,否则使用第二类预测模型(Mc)进行预测,若结果大于阈值则使用第二类预测模型(Mc)预测的结果,否则取第一类预测模型(Mb)和第二类预测模型(Mc)中得分高的作为预测结果;/n所述模型预测为对用户语音识别后的文本文本使用二分类预测模型(Ma)进行预测,得出预测结果,如果结果属于第二类预测模型(Mc),则使用第二类预测模型(Mc)进行预测,判断预测结果得分是否大于阈值,若得分大于阈值则使用第二类预测模型(Mc)预测的结果,否则使用第一类预测模型(Mb)进行预测,若结果大于阈值则使用第一类预测模型(Mb)预测的结果,否则取第一类预测模型(Mb)和第二类预测模型(Mc)中得分高的作为预测结果。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳勇艺达机器人有限公司,未经深圳勇艺达机器人有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910802162.X/,转载请声明来源钻瓜专利网。





