[发明专利]一种基于云计算对客体进行意图识别的方法在审
| 申请号: | 202011294988.9 | 申请日: | 2020-11-18 |
| 公开(公告)号: | CN112347232A | 公开(公告)日: | 2021-02-09 |
| 发明(设计)人: | 杜珍珍 | 申请(专利权)人: | 武汉贝多多网络科技有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/216;G06F40/289 |
| 代理公司: | 北京汇信合知识产权代理有限公司 11335 | 代理人: | 卢亮辉 |
| 地址: | 430000 湖北省武汉市江汉区武汉中央商务区泛海*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 计算 客体 进行 意图 识别 方法 | ||
1.一种基于云计算对客体进行意图识别的方法,其特征在于:所述识别方法包括如下步骤:
步骤1、构建分类器,先通过云计算网络建立训练集,然后将训练集通过特征处理模块进行特征处理,在特征处理的过程中生成特征向量以及期望输出,通过特征处理模块将特征处理过后的训练集建立成训练文本分类器;
步骤2、建立分类模型,通过所述步骤1构成的分类器建立分类模型,通过云计算抽取特征向量与对应的期望输出,按照固定的格式进行,一起输入至云计算中进行计算,训练出一个预测模型,通过整合预测模型和分类器形成分类模型;
步骤3、建立意图分类模型,通过云计算网络建立意图训练集,利用云计算对意图训练集进行特征化处理,在特征化处理的过程中生成意图特征向量,然后通过云计算抽取意图特征向量以及与之对应的意图类别;
步骤4、接受意图信息,接收到意图信息后通过所述步骤3中的意图分类模型对意图进行初步分类;
步骤5、识别结果,所述步骤4中对所接收的意图进行初步分类后利用云计算将分类结果映射至分类模型中的特征向量,从而通过确定特征向量定位与其对应的期望输出,被定为的期望输出则为意图的识别结果。
2.根据权利要求1所述的一种基于云计算对客体进行意图识别的方法,其特征在于:在所述步骤(1)构建分类器的过程中对新到的数据采取同样的特征抽取,得到用于预测的特征向量;使用训练好的预测模型,对处特征处理后的新数据进行预测,并返回结果。
3.根据权利要求1所述的一种基于云计算对客体进行意图识别的方法,其特征在于:在所述步骤(1)中对中文进行分词时,采用基于词典的中文分词和/或基于统计的中文分词。
4.根据权利要求3所述的一种基于云计算对客体进行意图识别的方法,其特征在于:所述基于词典的中文分词的核心是建立统一的词典表,当需要对一个句子进行分词时,首先将句子拆分成多个部分,将每一个部分与字典一一对应,如果该词语在词典中,分词成功,否则继续拆分匹配直到成功。
5.根据权利要求3所述的一种基于云计算对客体进行意图识别的方法,其特征在于:在所述基于统计的中文分词统计学中认为分词是一个概率最大化问题,即拆分句子,基于语料库,统计相邻的字组成的词语出现的概率,相邻的词出现的次数多,就出现的概率大,按照概率值进行分词。
6.根据权利要求1所述的一种基于云计算对客体进行意图识别的方法,其特征在于:在步骤(2)中利用TF和IDF两个参数来表示词语在文本中的重要程度,实现特征提取。
7.根据权利要求6所述的一种基于云计算对客体进行意图识别的方法,其特征在于:所述TF是词频,指的是一个词语在一个文档中出现的频率,一般情况下,每一个文档中出现的词语的次数越多词语的重要性更大,例如BOW模型一样用出现次数来表示特征值,即出现文档中的词语次数越多,其权重就越大,问题就是在长文档中的词语次数普遍比短文档中的次数多,导致特征值偏向差异情况。
8.根据权利要求6所述的一种基于云计算对客体进行意图识别的方法,其特征在于:所述步骤IDF是体现词语在文档间的重要性,即如果某个词语出现在极少数的文档中,说明该词语对于文档的区别性强,对应的特征值高,IDF值高,IDFi=log(|D|/Ni),D指的是文档总数,Ni指的是出现词语i的文档个数,很明显Ni越小,IDF的值越大,最终TF-IDF的特征值的表达式为:TF-IDF(i,j)=TFij*IDFi。
9.根据权利要求1所述的一种基于云计算对客体进行意图识别的方法,其特征在于:所述步骤(4)中接收意图信息的方式为互联网接收和物理键盘输入。
10.根据权利要求1所述的一种基于云计算对客体进行意图识别的方法,其特征在于:所述步骤(5)中在定位期望输出时通过云计算进行错误修正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉贝多多网络科技有限公司,未经武汉贝多多网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011294988.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自动进行多层遮盖喷漆的装置
- 下一篇:一种电缆挤包用组合式挤出机组





