[发明专利]一种新大数据标签生产方法及装置在审
申请号: | 201810223467.0 | 申请日: | 2018-03-19 |
公开(公告)号: | CN108427661A | 公开(公告)日: | 2018-08-21 |
发明(设计)人: | 邱晓贤;林国强;章武盛;周义豪;罗以攀;黄文杰;赵亨利;王松林;袁伟林 | 申请(专利权)人: | 广州汇智通信技术有限公司 |
主分类号: | G06F17/21 | 分类号: | G06F17/21;G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张春水;唐京桥 |
地址: | 510639 广东省广州市天*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 目标对象 标签生产 分析数据 大数据 公安技侦 海量数据 人类大脑 要素标签 挖掘 构建 算法 预置 语种 认知 预测 支撑 统计 建设 | ||
1.一种新大数据标签生产方法,其特征在于,包括:
获取涉嫌目标对象的待分析数据;
提取所述待分析数据的事实标签,所述事实标签包括所述涉嫌目标对象的属性、行为、关系和轨迹;
对所述事实标签进行挖掘,得到模型标签,所述模型标签包括所述涉嫌目标对象的统计标签、要素标签、语种标签和伴随标签;
将所述模型标签输入预置模型中,得到所述涉嫌目标对象的预测标签。
2.根据权利要求1所述的新大数据标签生产方法,其特征在于,所述根据所述事实标签进行挖掘具体包括:
S1:将所述涉嫌目标对象的属性、行为、关系和轨迹的文本内容与语言库中的预置文本进行匹配,得到所述涉嫌目标对象的语种标签;
S2:对所述涉嫌目标对象的属性、行为、关系和轨迹的文本内容进行要素提取,得到所述涉嫌目标对象的要素标签;
S3:对所述涉嫌目标对象的行为的次数进行统计运算,得到所述涉嫌目标对象的统计标签;
S4:获取与所述涉嫌目标对象相关的伴随者和/或伴随物品,确定所述伴随者和/或伴随物品的轨迹为第二轨迹,确定所述涉嫌目标对象的轨迹为第一轨迹,根据所述第一轨迹和所述第二轨迹的吻合度确定所述涉嫌目标对象的伴随标签;
S5:将所述统计标签、所述要素标签、所述语种标签和所述伴随标签组成所述涉嫌目标对象的模型标签。
3.根据权利要求1所述的新大数据标签生产方法,其特征在于,还包括:
获取所述涉嫌目标对象的自定义标签,所述自定义标签包括所述涉嫌目标对象的自定义属性、自定义行为、自定义关系和自定义轨迹;
选择所述自定义标签与所述事实标签存在区别的部分标记更新至所述事实标签中。
4.根据权利要求1至3任意一项所述的新大数据标签生产方法,其特征在于,所述预置模型为朴素贝叶斯或逻辑回归模型或相关向量机模型或随机森林模型。
5.一种新大数据标签生产装置,其特征在于,包括:
第一获取模块,用于获取涉嫌目标对象的待分析数据;
提取模块,用于提取所述待分析数据的事实标签,所述事实标签包括所述涉嫌目标对象的属性、行为、关系和轨迹;
挖掘模块,用于对所述事实标签进行挖掘,得到模型标签,所述模型标签包括所述涉嫌目标对象的统计标签、要素标签、语种标签和伴随标签;
评价模块,用于将所述模型标签输入预置模型中,得到所述涉嫌目标对象的预测标签。
6.根据权利要求5所述的新大数据标签生产装置,其特征在于,所述挖掘模块具体包括:
匹配单元,用于将所述涉嫌目标对象的属性、行为、关系和轨迹的文本内容与语言库中的预置文本进行匹配,得到所述涉嫌目标对象的语种标签;
提取单元,用于对所述涉嫌目标对象的属性、行为、关系和轨迹的文本内容进行要素提取,得到所述涉嫌目标对象的要素标签;
统计单元,用于对所述涉嫌目标对象的行为的次数进行统计运算,得到所述涉嫌目标对象的统计标签;
确定单元,用于获取与所述涉嫌目标对象相关的伴随者和/或伴随物品,确定所述伴随者和/或伴随物品的轨迹为第二轨迹,确定所述涉嫌目标对象的轨迹为第一轨迹,根据所述第一轨迹和所述第二轨迹的吻合度确定所述涉嫌目标对象的伴随标签;
组成单元,用于将所述统计标签、所述要素标签、所述语种标签和所述伴随标签组成所述涉嫌目标对象的模型标签。
7.根据权利要求5所述的新大数据标签生产装置,其特征在于,还包括:
第二获取模块,用于获取所述涉嫌目标对象的自定义标签,所述自定义标签包括所述涉嫌目标对象的自定义属性、自定义行为、自定义关系和自定义轨迹;
更新模块,用于选择所述自定义标签与所述事实标签存在区别的部分标记更新至所述事实标签中。
8.根据权利要求5至7任意一项所述的新大数据标签生产装置,其特征在于,所述预置模型为朴素贝叶斯或逻辑回归模型或相关向量机模型或随机森林模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州汇智通信技术有限公司,未经广州汇智通信技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810223467.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种响应式大屏展示方法和装置
- 下一篇:非法信息的展示方法和装置