[发明专利]命名实体纠错方法、装置、计算机设备和存储介质在审
申请号: | 202011493193.0 | 申请日: | 2020-12-17 |
公开(公告)号: | CN112560493A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 宁义双;吴粤敏;宁可 | 申请(专利权)人: | 金蝶软件(中国)有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/232 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 袁武 |
地址: | 518000 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 命名 实体 纠错 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种命名实体纠错方法、装置、计算机设备和存储介质。方法包括:获取与待纠错命名实体的音节相匹配的候选命名实体;获取待纠错命名实体所对应的待纠错声母集合,以及获取候选命名实体所对应的候选声母集合;确定待纠错声母集合中的待纠错声母所对应的模糊声母;确定模糊声母与对应的候选声母之间的声母差异值;获取待纠错命名实体所对应的待纠错韵母集合,以及获取候选命名实体所对应的候选韵母集合;确定待纠错韵母集合中的待纠错韵母所对应的模糊韵母;确定模糊韵母与对应的候选韵母之间的韵母差异值;当确定声母差异值和韵母差异值满足纠错条件时,将候选命名实体作为纠错后的命名实体。采用本方法能够提高命名实体输入的准确性。
技术领域
本申请涉及计算机技术领域,特别是涉及一种命名实体纠错方法、装置、计算机设备和存储介质。
背景技术
近年来,随着语音交互技术的应用与发展,将搜索与语音识别技术相结合,使得用户通过语音和自然语言就能实现搜索目的,从而推动搜索技术向认知搜索的方向发展。然而,由于受到用户方言习惯的影响,命名实体的识别(尤其是对企业业务实体、人名、组织名和机构名等)的能力通常无法满足真实业务的需要。例如,“陈其宁昨天创建的单子”可能会被识别为“陈其林昨天创建的单子”。此外,由于用户文本输入的随意性,可能会将用户查询中的实体(包括应用名、应用菜单名、人名、组织名和机构名等)输入为拼音相同、字形不同的谐音字。例如,“王小美昨天审核的”可能被识别为“王小眉昨天审核的”。因此,导致输入的命名实体不准确。
发明内容
基于此,有必要针对上述技术问题,提供一种命名实体纠错方法、装置、计算机设备和存储介质。
一种命名实体纠错方法,所述方法包括:
获取待纠错命名实体;
获取与所述待纠错命名实体的音节相匹配的候选命名实体;
获取所述待纠错命名实体所对应的待纠错声母集合,以及获取所述候选命名实体所对应的候选声母集合;
确定所述待纠错声母集合中的待纠错声母所对应的模糊声母;
确定所述模糊声母与对应的候选声母之间的声母差异值;所述候选声母在所述候选声母集合中;
获取所述待纠错命名实体所对应的待纠错韵母集合,以及获取所述候选命名实体所对应的候选韵母集合;
确定所述待纠错韵母集合中的待纠错韵母所对应的模糊韵母;
确定所述模糊韵母与对应的候选韵母之间的韵母差异值;所述候选韵母在所述候选韵母集合中;
当确定所述声母差异值和所述韵母差异值满足纠错条件时,将所述候选命名实体作为纠错后的命名实体。
一种命名实体纠错装置,所述装置包括:
获取模块,用于获取待纠错命名实体;
所述获取模块,用于获取与所述待纠错命名实体的音节相匹配的候选命名实体;
所述获取模块,用于获取所述待纠错命名实体所对应的待纠错声母集合,以及获取所述候选命名实体所对应的候选声母集合;
模糊声母确定模块,用于确定所述待纠错声母集合中的待纠错声母所对应的模糊声母;
声母差异值确定模块,用于确定所述模糊声母与对应的候选声母之间的声母差异值;所述候选声母在所述候选声母集合中;
所述获取模块,用于获取所述待纠错命名实体所对应的待纠错韵母集合,以及获取所述候选命名实体所对应的候选韵母集合;
模糊韵母确定模块,用于确定所述待纠错韵母集合中的待纠错韵母所对应的模糊韵母;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于金蝶软件(中国)有限公司,未经金蝶软件(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011493193.0/2.html,转载请声明来源钻瓜专利网。