[发明专利]辅助文本标注方法、装置、设备及其存储介质有效
申请号: | 202010266600.8 | 申请日: | 2020-04-07 |
公开(公告)号: | CN111611779B | 公开(公告)日: | 2023-10-13 |
发明(设计)人: | 张雨辰 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/169 | 分类号: | G06F40/169;G06F40/237 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 贾允 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 辅助 文本 标注 方法 装置 设备 及其 存储 介质 | ||
1.一种辅助文本标注方法,其特征在于,该方法包括:
获取对待标注文本进行预标注处理后的初始分词结果,所述初始分词结果包括多个初始词组和与每个所述初始词组一一对应的初始词性;
调用标准词库对所述初始分词结果进行校验审查,得到待修改词组和所述待修改词组的校验提示信息;
接收根据所述校验提示信息针对所述待修改词组输入的操作指令;
响应于所述操作指令对所述待修改词组进行调整,得到与所述待标注文本对应的标注结果。
2.根据权利要求1所述的方法,其特征在于,所述调用标准词库对所述初始分词结果进行校验审查包括:
调用所述标准词库对所述初始分词结果中每个所述初始词组和所述初始词组对应的初始词性进行校验,得到所述待修改词组和与所述待修改词组对应的修改策略;
显示与所述修改策略对应的校验提示信息。
3.根据权利要求2所述的方法,其特征在于,所述调用所述标准词库对所述初始分词结果中每个所述初始词组和所述初始词组对应的初始词性进行校验包括:
对所述初始分词结果中每个所述初始词组和所述初始词组对应的初始词性,与所述标准词库中的标准分词和所述标准分词对应的标准词性进行匹配,得到匹配结果;
根据所述匹配结果将匹配失败的初始词组作为待修改词组;
将所述待修改词组按照字粒度进行重组,得到多个第一重组分词;
调用所述标准词库对每个所述第一重组分词进行校验审核;
若所述第一重组分词与所述标准词库中标准分词一致,则生成与所述待修改词组对应的校验提示信息,所述校验提示信息用于指示将所述待修改词组按照所述第一重组分词进行调整的修改策略。
4.根据权利要求2所述的方法,其特征在于,所述调用所述标准词库对所述初始分词结果中每个所述初始词组和所述初始词组对应的初始词性进行校验包括:
将所述初始分词结果中的初始词组按照词粒度进行重组,得到多个第二重组分词;
调用所述标准词库对每个所述第二重组分词进行校验审核;
若所述第二重组分词与所述标准词库中的标准分词一致,则将与所述第二重组分词相关的初始词组作为待修改词组;并生成与所述第二重组分词对应的校验提示信息,所述校验提示信息用于指示按照所述第二重组分词对所述初始分词结果进行调整的修改策略。
5.根据权利要求2所述的方法,其特征在于,所述校验提示信息包括第一指示标识,所述第一指示标识用于指示与修改策略对应的修改类型,则所述显示与所述修改策略对应的校验提示信息包括:
获取所述待修改词组所对应的修改策略和所述修改策略所对应的修改类型;
确定与所述修改策略的修改类型对应的第一指示标识;
在标注界面的词典审查区域内显示添加所述第一指示标识后的所述待修改词组。
6.根据权利要求2所述的方法,其特征在于,所述校验提示信息还包括修改提示消息,所述修改提示消息用于提示与所述待修改词组对应的修改策略,则所述显示与所述修改策略对应的校验提示信息包括:
获取与所述待修改词组对应的修改策略;
对所述修改策略进行归类处理,得到多个修改提示消息,每个所述修改提示消息包括至少一个待修改词组和与每个所述待修改词组对应的修改策略;
在标注界面的提示区域内显示所述修改提示消息。
7.根据权利要求2所述的方法,其特征在于,所述显示与所述修改策略对应的校验提示信息还包括:
获取与所述待修改词组对应的第二指示标识,所述第二指示标识用于提示所述待修改词组在所述待标注文本中的原始位置;
在所述标注界面的原文显示区域内显示添加所述第二指示标识后的所述待修改词组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010266600.8/1.html,转载请声明来源钻瓜专利网。