[发明专利]一种实体识别方法、装置、计算设备及存储介质在审
| 申请号: | 202310391179.7 | 申请日: | 2023-04-12 |
| 公开(公告)号: | CN116562276A | 公开(公告)日: | 2023-08-08 |
| 发明(设计)人: | 徐丞申;李林;肖明勤;刘荣;黄萧;喻杰 | 申请(专利权)人: | 天津车之家软件有限公司 |
| 主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/289;G06F40/242;G06F16/903 |
| 代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 赵爱军;谢建云 |
| 地址: | 300467 天津市滨海新区生态城动漫中路126号*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 实体 识别 方法 装置 计算 设备 存储 介质 | ||
1.一种实体识别方法,在计算设备中执行,该方法包括:
获取待识别文本信息;
依次确定出所述待识别文本信息中的待替换的各第一字符串;
针对每一第一字符串,确定其对应的第二字符串,并生成该第一字符串和第二字符串之间的映射关系;
通过对利用各第二字符串替换对应的所述第一字符串得到的新的文本信息进行实体识别,得到各实体识别对象;
判断各所述第二字符串是否为实体识别对象;
若是,则利用所述映射关系,确定出该第二字符串对应的第一字符串,作为所述待识别文本信息的实体识别对象。
2.如权利要求1所述的方法,其中,依次确定出所述文本信息中的待替换的各第一字符串,包括:
判断所述待识别文本信息中的各字符串是否为预设词典中的字符串;
将属于所述预设词典中的字符串确定为所述第一字符串。
3.如权利要求2所述的方法,其中,生成该第一字符串和第二字符串之间的映射关系,包括:
以各第二字符串在所述新的文本信息中的字段位置和除所述第二字符串外的各字段的字段位置为键,所述第一字符串在所述待识别文本信息中的字段位置和除所述第一字符串外的各字段的字段位置为值,构建对应键值对,作为所述第一字符串和第二字符串之间的映射关系。
4.如权利要求3所述的方法,其中,还包括:
针对每一实体识别对象,判断其与任一第二字符串是否有字段重叠,若是,则确定该实体识别对象在所述新的文本信息中的开始位置和结束位置;
判断各实体识别对象的开始位置和/或更新后的结束位置是否与所述映射关系中指示相近位置的第二字符串的字段位置一致;
若不一致,则减小所述开始位置的值和/或增加所述结束位置的值,直到更新后的开始位置和结束位置与所述映射关系中对应第二字符串的字段位置相同,并将更新后的开始位置和结束位置所对应的字段作为更新后的实体识别对象。
5.如权利要求2所述的方法,其中,判断所述待识别文本信息中的各字符串是否为预设词典中的字符串,包括:
对所述待识别文本信息进行分词处理,并利用分词处理得到的各字符串与所述预设词典中的字符串进行匹配。
6.如权利要求4所述的方法,其中,判断各所述第二字符串是否为实体识别对象,包括:
判断各第二字符串在所述映射关系中的值是否与目标实体识别对象的开始位置和结束位置一致;
若一致,则确定该第二字符串为实体识别对象。
7.如权利要求1所述的方法,其中,还包括:
保存所述映射关系。
8.一种实体识别装置,驻留在计算设备中,该装置包括:
获取模块,获取待识别文本信息;
第一确定模块,适于依次确定出所述待识别文本信息中的待替换的各第一字符串;
生成模块,适于针对每一第一字符串,确定其对应的第二字符串,并生成该第一字符串和第二字符串之间的映射关系;
识别模块,适于通过对利用各第二字符串替换对应的所述第一字符串得到的新的文本信息进行实体识别,得到各实体识别对象;
判断模块,适于判断各所述第二字符串是否为实体识别对象;
第二确定模块,适于在判断第二字符串为实体识别对象时,利用所述映射关系,确定出该第二字符串对应的第一字符串,作为所述待识别文本信息的实体识别对象。
9.一种计算设备,包括:
至少一个处理器;和
存储有程序指令的存储器,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如权利要求1-7中任一项所述方法的指令。
10.一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行如权利要求1-7中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津车之家软件有限公司,未经天津车之家软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310391179.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:标靶支架及校准设备
- 下一篇:行业树的建立方法、装置、电子设备及存储介质





