[发明专利]一种基于云计算对客体进行意图识别的方法在审
| 申请号: | 202011294988.9 | 申请日: | 2020-11-18 |
| 公开(公告)号: | CN112347232A | 公开(公告)日: | 2021-02-09 |
| 发明(设计)人: | 杜珍珍 | 申请(专利权)人: | 武汉贝多多网络科技有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/216;G06F40/289 |
| 代理公司: | 北京汇信合知识产权代理有限公司 11335 | 代理人: | 卢亮辉 |
| 地址: | 430000 湖北省武汉市江汉区武汉中央商务区泛海*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 计算 客体 进行 意图 识别 方法 | ||
本申请公开了一种基于云计算对客体进行意图识别的方法,所述识别方法包括构建分类器,通过特征处理模块将特征处理过后的训练集建立成训练文本分类器;建立分类模型,通过所述步骤1构成的分类器建立分类模型,通过云计算抽取特征向量与对应的期望输出;建立意图分类模型,通过云计算网络建立意图训练集;接受意图信息,接收到意图信息后通过所述步骤3中的意图分类模型对意图进行初步分类;识别结果,所述步骤4中对所接收的意图进行初步分类后利用云计算将分类结果映射至分类模型中的特征向量,从而通过确定特征向量定位与其对应的期望输出,被定为的期望输出则为意图的识别结果。本申请提供了一种基于云计算对客体进行意图识别的方法。
技术领域
本申请涉及一种意图识别的方法,具体是一种基于云计算对客体进行意图识别的方法。
背景技术
意图识别方法是一种根据语句识别该语句的意图的识别方法,意图识别方法可以应用在各个领域,如移动终端对用户的意图识别以向用户提供相应的服务。例如,用户说出“我想打车回家”,则识别出用户的意图是想使用打车服务打车回到用户的住所,或者,用户说出“我想听歌”,则识别出用户的意图想使移动终端播放音乐。
传统的意图识别方法没有较为详细的特征提取步骤,同时识别效率低。因此,针对上述问题提出一种基于云计算对客体进行意图识别的方法。
发明内容
一种基于云计算对客体进行意图识别的方法,所述识别方法包括如下步骤:
步骤1、构建分类器,先通过云计算网络建立训练集,然后将训练集通过特征处理模块进行特征处理,在特征处理的过程中生成特征向量以及期望输出,通过特征处理模块将特征处理过后的训练集建立成训练文本分类器;
步骤2、建立分类模型,通过所述步骤1构成的分类器建立分类模型,通过云计算抽取特征向量与对应的期望输出,按照固定的格式进行,一起输入至云计算中进行计算,训练出一个预测模型,通过整合预测模型和分类器形成分类模型;
步骤3、建立意图分类模型,通过云计算网络建立意图训练集,利用云计算对意图训练集进行特征化处理,在特征化处理的过程中生成意图特征向量,然后通过云计算抽取意图特征向量以及与之对应的意图类别;
步骤4、接受意图信息,接收到意图信息后通过所述步骤3中的意图分类模型对意图进行初步分类;
步骤5、识别结果,所述步骤4中对所接收的意图进行初步分类后利用云计算将分类结果映射至分类模型中的特征向量,从而通过确定特征向量定位与其对应的期望输出,被定为的期望输出则为意图的识别结果。
进一步地,在所述步骤(1)构建分类器的过程中对新到的数据采取同样的特征抽取,得到用于预测的特征向量;使用训练好的预测模型,对处特征处理后的新数据进行预测,并返回结果。
进一步地,在所述步骤(1)中对中文进行分词时,采用基于词典的中文分词和/或基于统计的中文分词。
进一步地,所述基于词典的中文分词的核心是建立统一的词典表,当需要对一个句子进行分词时,首先将句子拆分成多个部分,将每一个部分与字典一一对应,如果该词语在词典中,分词成功,否则继续拆分匹配直到成功。
进一步地,在所述基于统计的中文分词统计学中认为分词是一个概率最大化问题,即拆分句子,基于语料库,统计相邻的字组成的词语出现的概率,相邻的词出现的次数多,就出现的概率大,按照概率值进行分词。
进一步地,在步骤(2)中利用TF和IDF两个参数来表示词语在文本中的重要程度,实现特征提取。
进一步地,所述TF是词频,指的是一个词语在一个文档中出现的频率,一般情况下,每一个文档中出现的词语的次数越多词语的重要性更大,例如BOW模型一样用出现次数来表示特征值,即出现文档中的词语次数越多,其权重就越大,问题就是在长文档中的词语次数普遍比短文档中的次数多,导致特征值偏向差异情况。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉贝多多网络科技有限公司,未经武汉贝多多网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011294988.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自动进行多层遮盖喷漆的装置
- 下一篇:一种电缆挤包用组合式挤出机组





