[发明专利]一种基于智慧社区大数据的知识图谱构建方法在审
申请号: | 202110307974.4 | 申请日: | 2021-03-23 |
公开(公告)号: | CN112883201A | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 王钊;郭瑞鹏;李鹏;武斌;张东燕;田卫东;申慧芳 | 申请(专利权)人: | 西安电子科技大学昆山创新研究院 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/23;G06F16/28 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 215300 江苏省苏州市昆*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 智慧 社区 数据 知识 图谱 构建 方法 | ||
1.一种基于智慧社区大数据的知识图谱构建方法,其特征在于:其包括以下步骤:
S1)获取数据,并根据数据类型将其划分为第一结构化数据、半结构化数据与非结构化数据;
S2)对半结构化数据与非结构化数据进行知识抽取,形成第二结构化数据;所述知识抽取包括实体抽取、语义类抽取以及关系属性抽取;
S3)对第一结构化数据进行数据整合,形成初步的智慧社区知识图谱;
S4)知识表示:对第二结构化数据以及第一结构化数据进行知识表示;
S5)知识融合:对所述第二结构化数据中的实体、关系以及实体的属性进行实体链接和知识合并;
S6)解决智慧社区图谱构建过程中的冲突;
S7)更新智慧社区知识图谱:数据模式层的更新和数据层的更新。
2.如权利要求1所述的基于智慧社区大数据的知识图谱构建方法,其特征在于:所述步骤S1)中,所述第一结构化数据包括人员姓名、性别、年龄、家庭结构、机动车辆信息、门禁进出时间信息、车库进出时间信息、车牌、电动车辆信息、人脸信息、访客信息、缴费信息、以及未知人员,其中未知人员为进入社区但并未与社区内任何家庭有关系的人员;所述第一结构化数据来源于智慧社区直接提供的关系数据库。
3.如权利要求1所述的基于智慧社区大数据的知识图谱构建方法,其特征在于:所述非结构化数据包括图片、音频、视频以及文本。
4.如权利要求1所述的基于智慧社区大数据的知识图谱构建方法,其特征在于:所述步骤S3)中,初步的智慧社区知识图谱的构建步骤包括:
S31)以小区保安、家庭、姓名实体作为节点,每个节点均包含有其对应的属性值;
S32)按照设定的关系将各节点进行连接,形成初步的智慧社区知识图谱。
5.如权利要求1所述的基于智慧社区大数据的知识图谱构建方法,其特征在于:所述步骤S2)中的语义类抽取包括并列相似度计算、上下位关系抽取以及语义类生成。
6.如权利要求5所述的基于智慧社区大数据的知识图谱构建方法,其特征在于:所述语义类生成包括:
S21)初始化领域种子词,准备设定数量的确定是属于该领域的词汇;
S22)根据这些种子词在测试语料中抽取规则,并进行打分,将设定分数以上的规则加入至规则库中;
S23)回归到测试语料,由规则库里的规则来匹配将要抽取的词汇,去除无用的词汇,将其余词汇加入词汇库;
S24)迭代重复步骤S22)~步骤S23),最终获得领域词汇。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学昆山创新研究院,未经西安电子科技大学昆山创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110307974.4/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置