[发明专利]一种标签标注方法和装置、计算机可读存储介质有效
| 申请号: | 201811221612.8 | 申请日: | 2018-10-19 |
| 公开(公告)号: | CN109508382B | 公开(公告)日: | 2020-08-21 |
| 发明(设计)人: | 徐安华;张亚启;欧阳佑;路德龙;马瑞璇 | 申请(专利权)人: | 北京明略软件系统有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36 |
| 代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 陶丽;李丹 |
| 地址: | 102218 北京市昌平区东小*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 标签 标注 方法 装置 计算机 可读 存储 介质 | ||
1.一种标签标注方法,其特征在于,包括:
检测待标注的文本中的实体是否是预先记录的实体;
如果是预先记录的实体,则获取所述预先记录的实体对应的标签类型状态链,所述标签类型状态链用于存储已标注的标签类型序列;根据所述标签类型状态链,对待标注的文本中的实体自动标注标签类型。
2.根据权利要求1所述的方法,其特征在于,假设所述标签类型状态链的长度为M,其中,M为自然数,所述根据所述标签类型状态链,对待标注的文本中的实体自动标注标签类型,包括:
统计所述预先记录的实体在所述待标注的文本中出现的次数N,其中,N为自然数;
如果N小于或等于M,则使用所述标签类型状态链中的前N个标签类型依次标注所述待标注的文本中的N个所述预先记录的实体;
如果N大于M,则使用所述标签类型状态链中的M个标签类型依次标注所述待标注的文本中的前M个所述预先记录的实体,使用所述标签类型状态链中的第M个标签类型标注所述待标注的文本中的第(M+1)至第N个所述预先记录的实体。
3.根据权利要求1所述的方法,其特征在于,所述方法之前还包括:
根据所述预先记录的实体,对所述待标注的文本进行分词。
4.根据权利要求3所述的方法,其特征在于,在对所述待标注的文本进行分词时,使用正向最大匹配算法进行分词,所述正向最大匹配算法具体为:以所述预先记录的实体为分词词典,将所述待标注的文本中与所述分词词典中最长匹配的连续字符作为选出的分词。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
检测所述待标注的文本中的实体是否更新标签类型且所述更新标签类型的实体是否为所述预先记录的实体;
如果所述待标注的文本中的实体更新标签类型且所述更新标签类型的实体不是预先记录的实体,则记录所述实体及其对应的标签类型状态链;
如果所述待标注的文本中的实体更新标签类型且所述更新标签类型的实体是预先记录的实体,则根据更新的所述标签类型,对所述实体对应的标签类型状态链进行相应的修改。
6.根据权利要求5所述的方法,其特征在于,当所述待标注的文本中对于某实体的第i个所述记录没有标注标签类型时,所述记录的实体对应的所述标签类型状态链中第i个所述标签类型为空,其中,i为自然数。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1至6中任一项所述的标签标注方法的步骤。
8.一种标签标注装置,其特征在于,包括处理器及存储器,其中:
所述处理器用于执行存储器中存储的标签标注程序,以实现如权利要求1至6中任一项所述的标签标注方法的步骤。
9.一种标签标注装置,其特征在于,包括存储模块、检测模块和自动标注模块,其中:
存储模块,用于存储预先记录的实体及所述实体对应的标签类型状态链,所述标签类型状态链用于存储已标注的标签类型序列;
检测模块,用于检测待标注的文本中的实体是否是所述存储模块中预先记录的实体,如果是预先记录的实体,通知自动标注模块;
自动标注模块,用于接收到检测模块的通知,获取所述存储模块中预先记录的实体对应的标签类型状态链,根据所述标签类型状态链,对待标注的文本中的实体自动标注标签类型。
10.根据权利要求9所述的标签标注装置,其特征在于,还包括记录模块,其中:
检测模块还用于,检测所述待标注的文本中的实体是否更新标签类型且所述更新标签类型的实体是否为所述预先记录的实体,如果所述待标注的文本中的实体更新标签类型且所述更新标签类型的实体不是所述存储模块预先记录的实体,发送第一通知至记录模块;如果所述待标注的文本中的实体更新标签类型且所述更新标签类型的实体是所述存储模块预先记录的实体,发送第二通知至记录模块;
记录模块,用于接收到检测模块的第一通知,记录所述实体及其对应的标签类型状态链至所述存储模块;接收到检测模块的第二通知,根据更新的所述标签类型,对所述存储模块中记录的所述实体对应的标签类型状态链进行相应的修改。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811221612.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:知识图谱的处理方法及装置
- 下一篇:知识图谱的构建方法及装置





