[发明专利]基于自然语言识别的信息处理方法、相关设备及存储介质在审
申请号: | 201910570636.2 | 申请日: | 2019-06-27 |
公开(公告)号: | CN110334347A | 公开(公告)日: | 2019-10-15 |
发明(设计)人: | 董磊;白坤;陈敏 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/28;G06F16/33;G06F16/36;G06F3/01;G10L15/26 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 黄威 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自然语言信息 自然语言识别 意图识别 信息处理 存储介质 相关信息 应答信息 修整 上下文环境 信息库 应答 运维 申请 匹配 | ||
1.一种基于自然语言识别的信息处理方法,其特征在于,包括:
获取待识别的自然语言信息;
根据相关信息对待识别的自然语言信息进行修整,其中,所述相关信息为待识别的自然语言信息的上文信息和/或下文信息;
对修整后的自然语言信息进行意图识别,得到意图识别结果;
基于所述意图识别结果从指定的应答信息库中获取对应的应答信息,并根据所述应答信息执行相应操作。
2.根据权利要求1所述的基于自然语言识别的信息处理方法,其特征在于,所述根据相关信息对待识别的自然语言信息进行修整,包括:
确定所述相关信息的语义结构;
基于所述语义结构对待识别的自然语言信息进行修整。
3.根据权利要求2所述的基于自然语言识别的信息处理方法,其特征在于,所述语义结构包括关键词、及所述关键词之间的关联关系;
所述基于所述语义结构对待识别的自然语言信息进行修整,包括:
基于所述关键词对待识别的自然语言信息进行信息填充;
基于所述关联关系对填充后的自然语言信息进行语序调整。
4.根据权利要求2所述的基于自然语言识别的信息处理方法,其特征在于,确定所述相关信息的语义结构,包括:
确定所述相关信息中各词语的词性和位置信息;
基于所述词性和位置信息,生成所述相关信息中每个词语之间的关联关系。
5.根据权利要求1-4任一项所述的基于自然语言识别的信息处理方法,其特征在于,所述对修整后的自然语言信息进行意图识别,得到意图识别结果,包括:
对所述修整后的自然语言信息进行分词处理,得到多个候选词;
基于预设知识库对多个候选词进行检索,得到检索结果;
根据所述检索结果对所述多个候选词进行更新;
基于更新后的候选词生成意图识别结果。
6.根据权利要求5所述的基于自然语言识别的信息处理方法,其特征在于,所述检索结果包括:与每一候选词匹配的样本词、及候选词与样本词之间的匹配度;
所述根据所述检索结果对所述多个候选词进行更新,包括:
从所述样本词中确定对应匹配度低于第一阈值的第一样本词;
将所述第一样本词替换所述多个候选词中与其匹配的候选词;
从所述样本词中确定对应匹配度低于第二阈值的第二样本词,其中,所述第一阈值大于所述第二阈值;
将所述多个候选词中与所述第二样本词匹配的候选词删除。
7.根据权利要求5所述的基于自然语言识别的信息处理方法,其特征在于,所述基于更新后的候选词生成意图识别结果,包括:
从更新后的候选词中识别实体;
确定所述实体所属的实体类型;
基于所述实体、所述实体类型及所述候选词,生成意图识别结果。
8.根据权利要求7所述的基于自然语言识别的信息处理方法,其特征在于,所述意图识别结果包括:意图词、实体、实体类型;
所述基于所述意图识别结果从指定的应答信息库中获取对应的应答信息,包括:
根据所述实体类型从多个预设的意图图谱中获取目标意图图谱,其中,所述目标意图图谱中至少包括:与所述实体关联的关联数据;
基于所述意图词、所述实体、及所述关联数据,从指定的应答信息库中获取对应的应答信息。
9.根据权利要求1所述的基于自然语言识别的信息处理方法,其特征在于,所述基于所述意图识别结果从指定的应答信息库中获取对应的应答信息,并根据所述应答信息执行相应操作,包括:
根据所述意图识别结果从指定的应答信息库中获取对应的应答信息;
获取所述应答信息的内容;
根据所述内容确定所述应答信息所属的任务类型;
基于所述任务类型和所述应答信息执行相应操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910570636.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种PDF文件的信息抽取方法和装置
- 下一篇:一种基于纯文本中的文字校验方法