[发明专利]基于Bert的篇章的多意图识别方法、设备及可读存储介质在审
申请号: | 202110480025.6 | 申请日: | 2021-04-30 |
公开(公告)号: | CN112989800A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 梁子敬 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 张娓娓;袁文婷 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 bert 篇章 意图 识别 方法 设备 可读 存储 介质 | ||
本发明涉及一种人工智能,提供一种基于Bert的篇章的多意图识别方法、装置、电子设备及计算机可读存储介质,其中方法包括:根据用户交互内容获取待识别篇章,其中,并按照预设规则将所述待识别篇章切分为至少两个识别单元;对所述识别单元进行要素拼接预处理;将预处理后的识别单元输入到Bert模型进行训练,获取每个识别单元的语义向量;将所述每个识别单元的语义向量输入到融合分类识别模型中,获取所述待识别篇章的意图信息。本发明主要目的在于通过Bert模型和lstm模型,解决篇章级别的理解和多意图识别的问题。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于Bert的篇章的多意图识别方法、装置、电子设备及计算机可读存储介质。
背景技术
在一些多轮交谈的实际场景中常常需要进行意图识别,在人机对话中容易出现一些智能客服无法解决的问题,或者用户需要一些升级服务,在上述过程中会涉及到提炼用户在与机器人问答过程中的意图(即:在多轮对话中,识别多个意图);以便将这些意图分配给对应业务熟悉的人工客服去处理。
其中,为了解决用户与智能客服在多轮交互中产生的问题或者描述性文字,将这些问题和描述性文字联合起来作为一个篇章,以便从整个语意层面来理解用户的意图,该过程需要解决两个难题,即:篇章级别的理解和多意图识别模型;但是目前业内并没有方法解决篇章级别的多意图识别的问题。
为了解决上述问题,亟需一种能够解决篇章级别的多意图识别的问题的识别方案。
发明内容
本发明提供一种基于Bert的篇章的多意图识别方法、装置、电子设备及计算机可读存储介质,其主要目的在于通过Bert模型和lstm模型,解决篇章级别的理解和多意图识别的问题。
为实现上述目的,本发明提供的基于Bert的篇章的多意图识别方法,应用于电子设备,所述方法包括:
根据用户交互内容获取待识别篇章,其中,并按照预设规则将所述待识别篇章切分为至少两个识别单元;
对所述识别单元进行要素拼接预处理;
将预处理后的识别单元输入到Bert模型进行训练,获取每个识别单元的语义向量;
将所述每个识别单元的语义向量输入到融合分类识别模型中,获取所述待识别篇章的意图信息。
可选地,所述根据用户交互内容获取待识别篇章,包括如下步骤:
获取用户与智能客服在多轮交互中产生的问题和表述性文字;
将所述问题和所述表述性文字相互联合,形成待识别篇章。
可选地,所述按照预设规则将所述待识别篇章切分为至少两个识别单元,包括如下步骤:
通过句子切分符号对所述待识别篇章进行切分处理;其中,所述预设规则包括句子切分符号,所述句子切分符号包括句号、分号、感叹号以及问号;
将所述待识别篇章切分形成的句子或者问题确定为识别单元。
可选地,所述对所述识别单元进行要素拼接预处理,包括如下步骤:
在所述每个识别单元的起始位置拼接本识别单元的至少两个意图信息;
在所述每个识别单元的末端位置拼接一个超参;
根据所述意图信息和所述超参,确定所述识别单元的语义符号序列。
可选地,所述将预处理的识别单元输入到Bert模型进行训练,获取每个识别单元的语义向量,包括如下步骤:
将所述语义符号序列输入所述Bert模型中,获取所述语义符号序列中每个语义符号的位置所对应的语义表示向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110480025.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:交错并联双向Buck-Boost变换器的控制电路
- 下一篇:安全型正压帐篷