[发明专利]一种人机交互中自然语言意图理解方法有效

申请号：	201610102111.2	申请日：	2016-02-25
公开（公告）号：	CN105786798B	公开（公告）日：	2018-11-02
发明（设计）人：	赵群飞;李瀚清;蒋天峰	申请（专利权）人：	上海交通大学
主分类号：	G06F17/27	分类号：	G06F17/27;G06F17/28
代理公司：	上海恒慧知识产权代理事务所(特殊普通合伙) 31317	代理人：	张宁展
地址：	200240 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种人机交互中自然语言意图理解的方法，首先对文本自然语言指令数据进行意图标注，将每句文本标注一个意图；然后将文本向量化，这里在传统的文本向量空间模型的基础上，融合了文本指令的词性信息，定义了一种新的文本表示模型——词性向量空间模型；然后，将堆栈式去噪自编码器应用于自然语言指令意图理解，提取指令的高阶特征；最后，用支持向量机进行训练和预测，实现自然语言指令的意图理解。本发明能够挖掘自然语言指令中更多的语义信息，提高意图理解的识别率，还采用了堆栈式去噪自编码器，在训练时加入随机噪声，更贴近实际应用场景，使得训练得到的模型具有更强的泛化能力。
搜索关键词：	一种人机交互自然语言意图理解方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种人机交互中自然语言意图理解方法，其特征在于，包括训练阶段和预测阶段，具体步骤如下：步骤1、建立指令体系数据库：根据对话应用场景，将对话的逻辑以及顺序以树形结构排列，树伸展的方向为对话进行的顺序，树的结点为一个意图；步骤2、对文本自然语言指令数据进行意图标注，将每句训练数据标注一个意图；步骤3、将文本自然语言指令数据向量化，构建词性向量空间模型，具体构建步骤是：步骤3.1归一化数据：根据预先建立的同义词表将训练数据中的同义词转换为同一个词；步骤3.2建立字典文件：该字典文件包含两列，即“词”和“权重”，词是归一化数据中出现的所有词和词性，即将词和词性以同等重要性进行统计，每行存储一个词或词性及其权重，共计D个词和词性；权重是每种词或词性出现的次数，采用逆文本频率log2(N/nk)其中N为归一化数据中的文本指令数目，nk为出现该词或词性的文本指令数；步骤3.3将归一化数据通过字典向量化：即将归一化数据中每行数据转化为一个D维向量；步骤3.4向量归一化：将得到的向量除以它的模，得到模为1的归一化向量；步骤4、用堆栈式去噪自编码器对词性向量空间模型中的向量进行压缩感知，提取指令的高阶特征，即高阶特征向量；步骤5、用支持向量机进行训练和预测，实现自然语言指令的意图理解。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海交通大学，未经上海交通大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610102111.2/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种人机交互中自然语言意图理解方法有效

专利文献下载