[发明专利]自然语言处理方法、装置、电子设备和存储介质在审
| 申请号: | 202110216915.6 | 申请日: | 2021-02-26 |
| 公开(公告)号: | CN112925889A | 公开(公告)日: | 2021-06-08 |
| 发明(设计)人: | 陈孝良;李良斌;常乐 | 申请(专利权)人: | 北京声智科技有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/335;G06F40/211;G06F40/30;G06K9/62;G06N3/08 |
| 代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 王英 |
| 地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 自然语言 处理 方法 装置 电子设备 存储 介质 | ||
1.一种自然语言处理方法,其特征在于,所述方法包括:
获取查询语句的多条候选语句;
确定所述查询语句和所述多条候选语句中各条语句的长度;
根据所述各条语句的长度,确定输入给语义识别模型的信息长度;
基于确定的所述信息长度对所述各条语句分别进行处理后,输入给所述语义识别模型得到所述查询语句和所述多条候选语句各自的语义信息;
基于所述语义信息确定各所述候选语句与所述查询语句的语义相似度。
2.根据权利要求1所述的方法,其特征在于,所述根据所述各条语句的长度,确定输入给语义识别模型的信息长度,包括:
确定所述各条语句的最大长度;
将所述最大长度与预设长度进行比较;
若所述最大长度大于或等于所述预设长度,则所述信息长度为所述预设长度;
若所述最大长度小于所述预设长度,则所述信息长度为所述最大长度。
3.根据权利要求1所述的方法,其特征在于,所述基于确定的所述信息长度对所述各条语句分别进行处理,包括:
对语句长度大于所述信息长度的语句,从所述语句中截取所述信息长度的语句内容;
对语句长度小于所述信息长度的语句,对所述语句进行填充处理得到所述信息长度的语句。
4.根据权利要求3所述的方法,其特征在于,所述对所述语句进行填充处理,包括:
以在句末补填充位的方式对所述语句进行填充处理。
5.根据权利要求1-4中任一所述的方法,其特征在于,所述语义识别模型为bert模型。
6.根据权利要求4所述的方法,其特征在于,所述语句中依序包括起始位、语句、结束位,所述以在句末补填充位的方式对所述语句进行填充处理,包括:
在语句的结束位后以补填充位的方式对所述语句进行填充处理。
7.根据权利要求1-4中任一所述的方法,其特征在于,所述基于所述语义信息确定各所述候选语句与所述查询语句的语义相似度之后,所述方法还包括:
筛选出语义相似度最高的候选语句;
获取语义相似度最高的候选语句对应的应答语句,对所述查询语句进行应答处理。
8.一种自然语言处理装置,其特征在于,所述装置包括:
获取模块,用于获取查询语句的多条候选语句;
语句长度确定模块,用于确定所述查询语句和所述多条候选语句中各条语句的长度;
信息长度确定模块,用于根据所述各条语句的长度,确定输入给语义识别模型的信息长度;
语义信息获取模块,用于处理模块执行基于确定的所述信息长度对所述各条语句分别进行处理后,输入给所述语义识别模型得到所述查询语句和所述多条候选语句各自的语义信息;
相似度确定模块,用于基于所述语义信息确定各所述候选语句与所述查询语句的语义相似度。
9.一种电子设备,其特征在于,包括至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任何一项所述的方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序用于使计算机执行权利要求1-7任何一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110216915.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种纸张印刷覆膜设备及其生产工艺
- 下一篇:目标群体分类方法及装置





