[发明专利]信息管理系统有效
| 申请号: | 201811158309.8 | 申请日: | 2018-09-30 |
| 公开(公告)号: | CN109376868B | 公开(公告)日: | 2021-06-25 |
| 发明(设计)人: | 沈科;曲景影;杨闰哲;李文峰;宝腾飞 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00;G06K9/62 |
| 代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
| 地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 信息管理 系统 | ||
本申请实施例公开了信息管理系统。该系统的一具体实施方式包括:该系统包括数据标注端,该数据标注端被配置成响应于接收到用户的数据标注请求,获取数据标注请求所指向的至少一条目标数据,以及与用户相关联的标签信息;展示该至少一条目标数据和标签信息;检测对应目标数据或目标数据中的词语的标签选取操作;响应于检测到标签选取操作,生成用于表征标签选取操作所指向的目标标签和所对应的目标数据或词语之间的对应关系的对应关系信息。该实施方式可以使用户通过在界面上执行标签选取操作来为目标数据或目标数据中的词语设置对应的标签,提高了用户的标注效率,节约了时间成本。
技术领域
本申请实施例涉及计算机技术领域,具体涉及信息管理系统。
背景技术
在对机器学习模型进行训练之前,通常需要准备训练数据,对训练数据进行标注。现有的人工标注方式通常是,标注人员在元数据管理系统中为训练数据设置对应的标签字段。而后对于每条训练数据,标注人员根据自己的经验确定与该训练数据对应的标签,将该标签作为该训练数据在该标签字段下的值。这种人工标注方式通常会耗费较高的时间成本。
发明内容
本申请实施例提出了信息管理系统。
本申请实施例提供了一种信息管理系统,该系统包括:数据标注端,被配置成响应于接收到用户的数据标注请求,获取数据标注请求所指向的至少一条目标数据,以及与用户相关联的标签信息;展示上述至少一条目标数据和标签信息;检测对应目标数据或目标数据中的词语的标签选取操作;响应于检测到标签选取操作,生成用于表征标签选取操作所指向的目标标签和所对应的目标数据或词语之间的对应关系的对应关系信息。
在一些实施例中,数据标注端进一步被配置成:获取与上述至少一条目标数据分别对应的预测标注结果;展示预测标注结果,以辅助用户进行数据标注。
在一些实施例中,上述系统还包括:数据整理端,被配置成接收用户的数据处理请求,基于数据处理请求,执行相应的处理操作。
在一些实施例中,数据整理端进一步被配置成:响应于确定数据处理请求是与数据集相关的数据统计请求,执行以下统计分析操作:获取数据处理请求所指向的第一数据集和与第一数据集对应的目标信息集合;对于目标信息集合中的目标信息,从第一数据集中选取出与该目标信息相关联的数据,对选取出的数据进行统计分析,生成与该目标信息对应的分析结果;向用户展示所生成的分析结果。
在一些实施例中,数据整理端进一步被配置成:响应于确定数据处理请求是与数据集相关的目标数据获取请求,执行以下获取操作:获取数据处理请求所指向的第二数据集和与第二数据集对应的目标类别标识;获取与目标类别标识相关联的分类模型;对于第二数据集中的数据,利用分类模型,对该数据进行类别预测,以确定该数据是否归属于目标类别标识所指示的目标类别;若归属于,则选取该数据作为目标数据;将选取出的目标数据返回给用户。
在一些实施例中,数据整理端进一步被配置成:响应于确定数据处理请求是对数据集之间进行比较的请求,执行以下第一比较操作:获取数据处理请求所指向的至少两个数据集和第一目标匹配方式;基于第一目标匹配方式,对上述至少两个数据集进行比较,生成第一比较结果;向用户展示第一比较结果。
在一些实施例中,数据整理端进一步被配置成:响应于确定数据处理请求是对数据集中的数据进行内容比较的请求,执行以下第二比较操作:获取数据处理请求所指向的至少两条数据和第二目标匹配方式;基于第二目标匹配方式,对上述至少两条数据的内容进行比较,生成第二比较结果;向用户展示第二比较结果。
在一些实施例中,数据整理端进一步被配置成:响应于确定数据处理请求是对数据集中的数据进行关联数据获取的请求,则执行以下关联数据获取操作:获取数据处理请求所指向的至少一条数据;将上述至少一条数据中的数据作为待匹配数据,确定待匹配数据与目标数据库中的数据之间的相似度;从目标数据库中获取与待匹配数据的相似度达到相似度阈值的数据作为待匹配数据的关联数据;将获取到的待匹配数据的关联数据返回给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811158309.8/2.html,转载请声明来源钻瓜专利网。





