[发明专利]语料标注方法和装置有效
申请号: | 201710980408.3 | 申请日: | 2017-10-19 |
公开(公告)号: | CN109683773B | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 杜志娟 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F3/0484 | 分类号: | G06F3/0484;G06F40/295;G06F16/31 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 赵囡囡 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语料 标注 方法 装置 | ||
1.一种语料标注方法,其特征在于,包括:
检测对待标注句子的文本选择操作;
在所述文本选择操作结束得到选择文本后,确定所述选择文本对应的标签;
在所述待标注句子的节点以外的位置显示所述选择文本对应的标签,以及将标注有所述选择文本对应的标签的所述待标注句子的位置信息和所述选择文本在所述待标注句子中的位置信息存储在预设数据库中;
在所述文本选择操作结束得到选择文本后,确定所述选择文本对应的标签包括:在所述文本选择操作结束得到所述选择文本后,触发显示包含至少一个预设标签的标签选择框;根据对所述预设标签的选择结果,确定所述选择文本对应的标签;其中,所述标签选择框中还包括对所述选择文本的撤销命令,当用户框选待标注句子中的文本后,发现有误,即可选择所述标签选择框中的撤销命令,撤销对所述文本的选择。
2.根据权利要求1所述的方法,其特征在于,检测对待标注句子的文本选择操作之前,所述方法还包括:
获取待标注文本;
对所述待标注文本进行分句操作,得到至少一个所述待标注句子。
3.根据权利要求1所述的方法,其特征在于,在所述文本选择操作结束得到所述选择文本后,触发显示包含至少一个预设标签的标签选择框包括:
在所述文本选择操作结束得到所述选择文本后,根据所述选择文本的位置信息,计算所述标签选择框的显示位置;
在所述显示位置显示所述标签选择框。
4.根据权利要求1-3中任意一项所述的方法,其特征在于,所述标签为命名实体类别标签。
5.一种语料标注装置,其特征在于,包括:
检测模块,用于检测对待标注句子的文本选择操作;
第一确定模块,用于在所述文本选择操作结束得到选择文本后,确定所述选择文本对应的标签;
处理模块,用于在所述待标注句子的节点以外的位置显示所述选择文本对应的标签,以及将标注有所述选择文本对应的标签的所述待标注句子的位置信息和所述选择文本在所述待标注句子中的位置信息存储在预设数据库中;
所述第一确定模块包括:触发模块,用于在所述文本选择操作结束得到所述选择文本后,触发显示包含至少一个预设标签的标签选择框;第二确定模块,用于根据对所述预设标签的选择结果,确定所述选择文本对应的标签;其中,所述标签选择框中还包括对所述选择文本的撤销命令,当用户框选待标注句子中的文本后,发现有误,即可选择所述标签选择框中的撤销命令,撤销对所述文本的选择。
6.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至4中任意一项所述的语料标注方法。
7.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至4中任意一项所述的语料标注方法。
8.一种终端,其特征在于,包括:
检测模块,用于检测对待标注句子的文本选择操作;
第一确定模块,用于在所述文本选择操作结束得到选择文本后,确定所述选择文本对应的标签;
处理模块,用于在所述待标注句子的节点以外的位置显示所述选择文本对应的标签,以及将标注有所述选择文本对应的标签的所述待标注句子的位置信息和所述选择文本在所述待标注句子中的位置信息存储在预设数据库中;
处理器,所述处理器运行程序,其中,所述程序运行时对于从所述检测模块、所述第一确定模块和所述处理模块输出的数据执行权利要求1至4中任意一项所述的语料标注方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710980408.3/1.html,转载请声明来源钻瓜专利网。