[发明专利]数据筛选方法、装置及电子设备有效

专利信息
申请号: 202011265721.7 申请日: 2020-11-13
公开(公告)号: CN112069305B 公开(公告)日: 2021-03-30
发明(设计)人: 范辉;李青龙 申请(专利权)人: 北京智慧星光信息技术有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06F16/31;G06F40/253
代理公司: 北京智宇正信知识产权代理事务所(普通合伙) 11876 代理人: 李明卓
地址: 100080 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据 筛选 方法 装置 电子设备
【权利要求书】:

1.一种数据筛选方法,其特征在于,包括:

获取至少一个用户表达式,所述用户表达式包括用户词以及逻辑词,所述用户词为数据筛选的关键词,所述逻辑词为关键词的连接词;

对所述用户表达式进行语法分析,建立所述用户表达式对应的树形数据结构;

依次提取各个所述树形数据结构中的用户词,并将提取出的所述用户词与目标文档进行匹配,确定与所述目标文档匹配的第一目标表达式,其中,各个所述第一目标表达式对应有唯一的标识;

根据所述第一目标表达式中的所述逻辑词,确定与所述目标文档匹配的第二目标表达式;

其中,所述对所述用户表达式进行语法分析,建立所述用户表达式对应的树形数据结构,包括:

对所述用户表达式进行语法分析,确定所述树形数据结构的根节点以及子节点;

遍历所述子节点,将至少两个连续且相同的或子节点的节点对象存储在最上面的或子节点中;

基于所述用户表达式,对各个所述子节点进行属性变量的设置,以得到所述树形数据结构,所述属性变量包括词距或词距的正负号中的至少一种;

所述依次提取各个所述树形数据结构中的用户词,并将提取出的所述用户词与所述目标文档进行匹配,确定与所述目标文档匹配的第一目标表达式,包括:

对于各个所述用户词,在所述目标文档中进行搜索,以确定所述目标文档中是否存在所述用户词;

当所述目标文档中存在所述用户词时,确定所述用户词对应的所述第一目标表达式并建立所述目标文档与所述第一目标表达式的对应关系;

所述树形数据结构中树节点的结构描述为:

{

左右孩子接连链接指针,父节点链接指针;

节点类型;

用户词,当节点类型为NODE_WORD时本字段存储对应的用户词,NODE_WORD类型的节点是表达式树的叶子节点;

NEAR类型节点的属性变量:词距,词距的正负号;

OR节点数组;

用户词集合

};

其中,所述根据所述第一目标表达式中的所述逻辑词,确定与所述目标文档匹配的第二目标表达式,包括:

遍历所述第一目标表达式对应的树形数据结构,确定所述第一目标表达式中的逻辑词;

基于所述第一目标表达式中的逻辑词,确定所有所述第一目标表达式中与所述目标文档匹配的第二目标表达式。

2.根据权利要求1所述的方法,其特征在于,所述基于所述第一目标表达式中的逻辑词,确定所有所述第一目标表达式中与所述目标文档匹配的第二目标表达式,包括:

基于所述第一目标表达式中的标识符,确定所述第一目标表达式中的屏蔽词以及歧义词;

利用所述屏蔽词以及所述歧义词,对所述第一目标表达式进行筛选;

利用所述逻辑词对筛选后的所述第一目标表达式进行再次筛选,确定所有所述第一目标表达式中与所述目标文档匹配的第二目标表达式。

3.根据权利要求2所述的方法,其特征在于,所述基于所述第一目标表达式中的标识符,确定所述第一目标表达式中的屏蔽词以及歧义词,包括:

遍历所述第一目标表达式,确定所述第一目标表达式中的预设标识符,所述预设标识符分别与所述屏蔽词以及所述歧义词对应;

利用所述预设标识符,确定所述第一目标表达式中的屏蔽词以及歧义词。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智慧星光信息技术有限公司,未经北京智慧星光信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011265721.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top