[发明专利]一种基于bert+bilstm+crf与xgboost模型的多意图识别方法和系统有效
申请号: | 202210432349.7 | 申请日: | 2022-04-22 |
公开(公告)号: | CN114818665B | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 陈波;朱舜文;曾俊涛;陈圩钦;邓媛丹;王庆先 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/284;G06F40/30;G06F18/241 |
代理公司: | 成都先导云创知识产权代理事务所(普通合伙) 51321 | 代理人: | 李坤 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 bert bilstm crf xgboost 模型 意图 识别 方法 系统 | ||
1.一种基于bert+bilstm+crf与xgboost模型的多意图识别方法,其特征在于,包括如下步骤:
步骤1:通过得到用户的交互文本或者语音信息,构建数据集;
步骤2:对所述数据集进行预处理,得到标准格式数据;
步骤3:通过bert+bilstm+crf模型将所述标准格式数据转换为特征句向量;
步骤4:通过Xgboost模型训练相应的特征句向量模型来进行意图识别,识别用户交互意图并输出所有的主意图;
步骤5:利用TF-IDF模型计算同一主意图的所有文本数据中的意图对该类意图的贡献,确定标准意图,其他意图则为子意图,将标准意图的句向量作为标准句向量;
步骤6:通过bert模型将各子意图进行分类并输出个子意图类别。
2.根据权利要求1所述的一种基于bert+bilstm+crf与xgboost模型的多意图识别方法,其特征在于,所述步骤2中的预处理包括对数据集进行去停用词和标注。
3.根据权利要求1所述的一种基于bert+bilstm+crf与xgboost模型的多意图识别方法,其特征在于,所述特征句向量包括词向量、词性向量和命名实体向量。
4.根据权利要求3所述的一种基于bert+bilstm+crf与xgboost模型的多意图识别方法,其特征在于,所述步骤3中具体包括;利用了bert模型将标准格式数据转换为词向量,再由bilstm+crf模型计算出词性向量和命名实体向量。
5.根据权利要求1所述的一种基于bert+bilstm+crf与xgboost模型的多意图识别方法,其特征在于,所述bert+bilstm+crf模型的公式如下:
(1)headi=Attention(QWiQ,KWiK,VWiv)
(2)
(3)MultiHead(Q,K,V)=Concat(head1,...,headn)Wo
式中:Q、K、V为字向量矩阵,dk是嵌入层维度,而MultiHead自注意力机制则是通过对Q、K、V进行投影,将自注意力机制结果拼接,如公式(2)和公式(3)。
6.一种基于bert+bilstm+crf与xgboost模型的多意图识别系统,用于执行权利要求1-5中任一所述的方法,其特征在于,包括语音接收模块,该模块的功能是用于识别用户语音;语音转换文本模块,用于接收语音之后的文本转换功能;意图识别模块,用于基于bert+bilstm+crf所述的标准意图选取,多意图识别;交互模块,用于识别用户意图后执行意图。
7.一种电子设备,其特征在于,所述电子设备包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为上述电子设备的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行权利要求1-5中任一所述的方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现权利要求1-5中任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210432349.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于人脸视频图像点阵的肿瘤风险辅助评估方法
- 下一篇:一种固沙车