[发明专利]一种数学算式识别方法、装置、设备及可读存储介质有效
| 申请号: | 201910916522.9 | 申请日: | 2019-09-26 |
| 公开(公告)号: | CN110633474B | 公开(公告)日: | 2023-04-18 |
| 发明(设计)人: | 高丛;苏少炜;陈孝良 | 申请(专利权)人: | 北京声智科技有限公司 |
| 主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/211 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杨华 |
| 地址: | 100080 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数学 算式 识别 方法 装置 设备 可读 存储 介质 | ||
本申请提供了一种数学算式识别方法、装置、设备及可读存储介质,其中,方法包括:获取采用自然语言描述目标数学算式的目标句子;对目标句子进行命名实体识别,获得目标句子的命名实体识别结果,其中,命名实体识别结果包括目标句子中所包含的命名实体,以及每个命名实体对应的实体类型,目标句子中所包含的命名实体包括用于描述数字的词、用于描述运算符号的词、用于描述求取子式运算结果的词,一命名实体对应的实体类型用于指示该命名实体所描述的内容;根据目标句子的命名实体识别结果,将目标句子转换为符号化的目标数学算式。本申请根据目标句子的命名实体识别结果,能够准确地将用自然语言描述的数学算式识别为符号化的数学算式。
技术领域
本申请涉及自然语言处理技术领域,尤其涉及一种数学算式识别方法、装置、设备及可读存储介质。
背景技术
在某些应用场景中,需要将用自然语言描述的数学算式转换为符号化的目标数学算式,比如,人工智能领域的聊天机器人,对于聊天机器人而言,数学计算通常是其应具备的技能,聊天机器人获得的输入数据通常是用户用自然语言描述的数学算式,而用自然语言描述的数学算式是其无法理解的,这就需要将用自然语言描述的数学算式转换为机器可以理解的符号化的数学算式。
发明内容
有鉴于此,本申请提供了一种数学算式识别方法,用以将用自然语言描述的数学算式识别为符号化的数学算式,其技术方案如下:
一种数学算式识别方法,包括:
获取目标句子,其中,目标句子为采用自然语言描述目标数学算式的句子;
对目标句子进行命名实体识别,获得目标句子的命名实体识别结果,其中,命名实体识别结果包括目标句子中所包含的命名实体,以及每个命名实体对应的实体类型,目标句子中所包含的命名实体包括用于描述数字的词、用于描述运算符号的词、用于描述求取子式运算结果的词,一命名实体对应的实体类型用于指示该命名实体所描述的内容;
根据目标句子的命名实体识别结果,将目标句子转换为符号化的目标数学算式。
优选地,对目标句子进行命名实体识别,获得目标句子的命名实体识别结果,包括:
将目标句子输入预先建立的命名实体识别模型,获得目标句子中所包含的命名实体以及每个命名实体的实体类型;
其中,命名实体识别模型采用标注有命名实体以及实体类型的训练样本训练得到,训练样本为采用自然语言描述数学算式的句子。
优选地,根据目标句子的命名实体识别结果,将目标句子转换为符号化的目标数学算式,包括:
对目标句子进行分词,获得分词结果;
通过目标句子的命名实体识别结果,对分词结果进行修正,获得有序词序列;
将有序词序列中为命名实体的各个词转换为符号,获得有序符号序列;
根据有序词序列、有序符号序列以及目标句子的命名实体识别结果,确定符号化的目标数学算式。
优选地,将有序词序列中为命名实体的各个词转换为符号,获得有序符号序列,包括:
依次遍历有序词序列中的词:
若当前遍历到的词为命名实体,且该命名实体对应的实体类型指示该命名实体为用于描述数字的词,则将当前遍历到的词转换为其描述的数字;
若当前遍历到的词为命名实体,且该命名实体对应的实体类型指示该命名实体为用于描述运算符号的词,则将当前遍历到的词转换为其描述的运算符号;
若当前遍历到的词为命名实体,且该命名实体对应的实体类型指示该命名实体为用于描述求取子式运算结果的词,则将当前遍历到的词转换为其描述的用于求取子式运算结果的符号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910916522.9/2.html,转载请声明来源钻瓜专利网。





