[发明专利]基于人工智能的资源池对象数据挖掘方法及系统有效
申请号: | 202210135879.5 | 申请日: | 2022-02-15 |
公开(公告)号: | CN114201973B | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 张建明;王海灵 | 申请(专利权)人: | 深圳博士创新技术转移有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06K9/62 |
代理公司: | 广州博联知识产权代理有限公司 44663 | 代理人: | 梁志标 |
地址: | 518000 广东省深圳市南山区粤海街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 资源 对象 数据 挖掘 方法 系统 | ||
1.一种基于人工智能的资源池对象数据挖掘方法,其特征在于,应用于对象数据挖掘系统,所述方法至少包括:
查找目标对象数据,所述目标对象数据包括设定对象标签中的M个对象语义提取数据,M为正整数;
将所述目标对象数据解析为M个单元对象数据,每个单元对象数据包括一个对象语义提取数据;
对于每个单元对象数据,基于所述单元对象数据的第一技术语义向量序列和参考对象数据的第二技术语义向量序列,确定所述单元对象数据中的对象语义提取数据是否为设定技术标签的对象语义提取数据;其中,所述参考对象数据是事先用于进行比较配置的,且所述参考对象数据包括设定技术标签的对象语义提取数据;
基于设定技术标签的对象语义提取数据的有效语义向量数量确定所述设定技术标签的对象语义提取数据的技术匹配性;
所述将所述目标对象数据解析为M个单元对象数据,包括:
将所述目标对象数据传递到完成权重指示优化的AI训练模型,并基于所述AI训练模型分别游走所述目标对象数据的每个对象段落数据,并确定所述对象段落数据的对象语义向量是否对应有技术标签属性,如果确定是,则将所述对象段落数据解析为一个单元对象数据;其中,在AI训练模型的模型权重指示优化流程中,将参考对象标定数据序列传递到AI训练模型,所述参考对象标定数据序列包括多个参考对象数据,所述参考对象数据包括设定对象标签中的不少于一个对象语义提取数据,每个对象语义提取数据具有记录向量信息,所述记录向量信息标定有技术标签属性,以使AI训练模型基于所述参考对象标定数据序列进行模型权重指示优化,得到记录向量信息的对象语义向量与技术标签属性的关联学习向量;
所述基于所述单元对象数据的第一技术语义向量序列和参考对象数据的第二技术语义向量序列,确定所述单元对象数据中的对象语义提取数据是否为设定技术标签的对象语义提取数据,包括:
如果事先用于进行比较配置的参考对象数据的数量为不少于两个,确定所述单元对象数据的第一技术语义向量序列与每个参考对象数据的第二技术语义向量序列的匹配程度;
如果最大匹配程度大于预设匹配程度,则确定所述单元对象数据中的对象语义提取数据为所述最大匹配程度对应的参考对象数据中的设定技术标签的对象语义提取数据;
所述单元对象数据的第一技术语义向量序列的提取步骤,包括:
获取所述单元对象数据的对象语句分段数据,获取所述单元对象数据的对象关键词联系数据;
基于所述单元对象数据的对象语句分段数据和所述单元对象数据的对象关键词联系数据,确定所述单元对象数据的第一技术语义向量序列;
所述参考对象数据的第二技术语义向量序列的提取步骤,包括:
获取参考对象数据的对象语句分段数据,获取参考对象数据的对象关键词联系数据;
基于参考对象数据的对象语句分段数据和参考对象数据的对象关键词联系数据,确定所述参考对象数据的第二技术语义向量序列;
所述预设匹配程度的提取步骤,包括:
确定参考对象语义提取数据对象数据的技术语义向量序列与参考对象数据的技术语义向量序列的第一匹配程度;
确定参考对象标定数据的技术语义向量序列与参考对象数据的技术语义向量序列的第二匹配程度;
基于所述第一匹配程度和所述第二匹配程度确定所述预设匹配程度,所述预设匹配程度小于所述第一匹配程度,所述预设匹配程度大于所述第二匹配程度;其中,所述参考对象语义提取数据对象数据中的设定技术标签的对象语义提取数据与所述参考对象数据中的设定技术标签的对象语义提取数据相同;
所述参考对象标定数据未包括设定技术标签的对象语义提取数据,或者,所述参考对象标定数据中的设定技术标签的对象语义提取数据与所述参考对象数据中的设定技术标签的对象语义提取数据不同;
所述查找目标对象数据包括:
从对象数据挖掘系统获取基础对象数据,所述基础对象数据包括设定对象标签中的M个对象语义提取数据;
确定所述基础对象数据中的对象语义提取数据是否无效;
如果确定否,则将所述基础对象数据确定为所述目标对象数据;
如果确定是,则提示所述对象数据挖掘系统再次获取基础对象数据;
所述确定所述基础对象数据中的对象语义提取数据是否无效,包括:
基于所述基础对象数据和公告对象数据确定差异对象数据;其中,所述公告对象数据是所述设定对象标签中未包括对象语义提取数据时解析到的对象数据;
将所述基础对象数据解析为M个单元对象数据,每个单元对象数据包括一个对象语义提取数据,并确定所述M个单元对象数据对应的联系对象数据;
确定所述差异对象数据与所述联系对象数据的关联信息;
基于所述关联信息确定所述基础对象数据中的对象语义提取数据是否无效。
2.一种基于人工智能的资源池对象数据挖掘系统,其特征在于,包括互相之间通信的处理器和存储器,所述处理器用于从所述存储器中调取计算机程序,并通过运行所述计算机程序实现权利要求1所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳博士创新技术转移有限公司,未经深圳博士创新技术转移有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210135879.5/1.html,转载请声明来源钻瓜专利网。