[发明专利]辅助人工文本标注的方法和系统在审

专利信息
申请号: 202010676137.4 申请日: 2020-07-14
公开(公告)号: CN113935283A 公开(公告)日: 2022-01-14
发明(设计)人: 王雨萱;徐昀;李章誉 申请(专利权)人: 第四范式(北京)技术有限公司
主分类号: G06F40/117 分类号: G06F40/117
代理公司: 北京铭硕知识产权代理有限公司 11286 代理人: 苏银虹;张云珠
地址: 100085 北京市海淀区清*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 辅助 人工 文本 标注 方法 系统
【说明书】:

提供一种辅助人工文本标注的方法和系统。所述方法包括:展示文本标注页面,其中,所述文本标注页面包括文本区;检测用户在所述文本区中的标注操作,其中,所述标注操作包括标注节点和标注关系中的至少一个;响应于检测到用户在所述文本区中正在标注节点,在所述文本区中显示用户正在标注的节点的标注信息,并以更低的视觉明显程度显示已标节点和已标关系的标注信息;响应于检测到用户在所述文本区中正在标注关系,在所述文本区中显示用户正在标注的关系的标注信息,并以更低的视觉明显程度显示已标节点和已标关系的标注信息。

技术领域

本公开总体说来涉及文本标注技术,更具体地讲,涉及一种辅助人工文本标注的方法和系统。

背景技术

人工标注过程可概括为人工提取文本中的实体,并对每个实体进行分类或打标签。对于有监督的机器学习,需要有标注的数据来作为先验经验,标注的数量和质量,一定程度上决定着机器学习的最终效果。

标注从整体上可分为标注节点和标注关系两类。以知识图谱为例,文本标注主要集中在冷启动阶段(机器尚未开始学习),假如需要让机器学会什么是“公司”,需要人工在多篇文本中将符合“公司”语义的内容标注出来,然后模型以此为输入逐渐掌握“公司”的文本特征,以实现自动检测,自动识别,这就称为标注节点。同理,如果需要让机器学会“创始人-建立-公司”这样的完整关系,需要先指明当前正在标注的关系类型(“创始人-建立-公司”),并依次标出前置节点(“创始人”)、与后置节点(“公司”),这就称为标注关系。

现有人工标注方法中,标注节点和标注关系会分为两个页面进行,即,不能在同一文本区域中既标注节点、又标注关系,这增加了用户的认知成本与标注工作量。

发明内容

本公开的示例性实施例可至少解决上述问题,也可不解决上述问题。

根据本公开的一方面,提供一种辅助人工文本标注的方法,包括:展示文本标注页面,其中,所述文本标注页面包括文本区;检测用户在所述文本区中的标注操作,其中,所述标注操作包括标注节点和标注关系中的至少一个;响应于检测到用户在所述文本区中正在标注节点,在所述文本区中显示用户正在标注的节点的标注信息,并以更低的视觉明显程度显示已标节点和已标关系的标注信息;响应于检测到用户在所述文本区中正在标注关系,在所述文本区中显示用户正在标注的关系的标注信息,并以更低的视觉明显程度显示已标节点和已标关系的标注信息。

可选地,关系的标注信息的显示状态可包括第一关系显示状态和第二关系显示状态,第一关系显示状态和第二关系显示状态的视觉明显程度依次降低;节点的标注信息的显示状态可包括第一节点显示状态和第二节点显示状态,第一节点显示状态和第二节点显示状态的视觉明显程度依次降低;所述响应于检测到用户在所述文本区中正在标注关系,在所述文本区中显示用户正在标注的关系的标注信息,并以更低的视觉明显程度显示已标节点和已标关系的标注信息的步骤可包括:以第一关系显示状态显示用户正在标注的关系的标注信息;以第二关系显示状态显示已标关系的标注信息;以第二节点显示状态显示已标节点的标注信息;所述响应于检测到用户在所述文本区中正在标注节点,在所述文本区中显示用户正在标注的节点的标注信息的步骤包括:以第一节点显示状态显示用户正在标注的节点的标注信息。

可选地,所述第二节点显示状态可包括第一子状态和第二子状态,第一子状态和第二子状态的视觉明显程度依次降低;所述以第二节点显示状态显示已标节点的标注信息的步骤可包括:以第一子状态显示已标节点中的第一节点的标注信息;以第二子状态显示已标节点中的第二节点的标注信息;其中,第一节点是属于与用户正在标注的关系相关的节点类型的节点,第二节点是不属于与用户正在标注的关系相关的节点类型的节点。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010676137.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top