[发明专利]基于会议记录构建知识图谱的方法、装置及处理器在审

专利信息
申请号: 202011232612.5 申请日: 2020-11-06
公开(公告)号: CN112487197A 公开(公告)日: 2021-03-12
发明(设计)人: 黄跃峰;周阳;周志忠;霍斌 申请(专利权)人: 中科云谷科技有限公司;中联重科股份有限公司
主分类号: G06F16/36 分类号: G06F16/36;G06F40/289;G06F40/211;G06F40/253;G06F40/30;G06K9/62
代理公司: 北京润平知识产权代理有限公司 11283 代理人: 肖冰滨;王晓晓
地址: 201306 上海市浦东*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 会议记录 构建 知识 图谱 方法 装置 处理器
【说明书】:

发明实施例提供一种基于会议记录构建知识图谱的方法、装置、处理器及存储介质。方法包括:获取会议记录文本,会议记录文本通过语音会议记录转换得到;通过语言模型对会议记录文本进行预处理,语言模型是根据预设专业领域的语料数据进行训练得到的;提取出预处理后的会议记录文本中的实体及实体之间的关系;根据实体及实体之间的关系建立对应的知识图谱,可以对在会议中即时记录的语音信息转换为更容易阅读和理解的结构化知识,从而优化了会议场景下连续的语音可能出现的断句问题,提升了会议纪要的细腻度和精度,同时能够对会议中提到的大量内容中提取出会议的核心内容,构建结构化的知识图谱,减少人工的筛选,大幅度地提升了内容的可读性。

技术领域

本发明涉及计算机技术领域,具体地涉及一种基于会议记录构建知识图谱的方法、装置及处理器。

背景技术

知识图谱,是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。

然而,现有技术中,知识图谱的构建都是基于直接的文本创建的,并且构建的知识图谱与各个文本对应的专业领域是毫不相关的,导致创建的知识图谱与专业领域相关,无法针对特定的文本建立相关的知识图谱。

发明内容

本发明实施例的目的是提供一种基于会议记录构建知识图谱的方法、装置、处理器及存储介质。

为了实现上述目的,本发明第一方面提供一种基于会议记录构建知识图谱的方法,包括:

获取会议记录文本,会议记录文本通过语音会议记录转换得到;

通过语言模型对会议记录文本进行预处理,语言模型是根据预设专业领域的语料数据进行训练得到的;

提取出预处理后的会议记录文本中的实体及实体之间的关系;

根据实体及实体之间的关系建立对应的知识图谱。

在本发明的实施例中,通过语言模型对会议记录文本进行预处理包括:将会议记录文本输入至语言模型,通过语言模型确定会议记录文本中包含的指代词和主语;对指代词和主语进行分类,确定指代词对应的替代主语;将会议记录文本中的指代词替换为与替代主语,得到预处理后的会议记录文本。

在本发明的实施例中,对指代词和主语进行分类,确定指代词对应的替代主语包括:确定每个指代词对应的候选词;将候选词转换为特征向量;确定每个特征向量对应的置信度;将置信度最高的特征向量对应的候选词作为指代词对应的替代主语。

在本发明的实施例中,提取出预处理后的会议记录文本中的实体及实体之间的关系包括:通过语言模型确定预处理后的会议记录文本中的实体;确定实体对应的专业领域;根据专业领域确定实体对应的类别;根据实体以及实体对应的类别确定实体及实体之间的关系。

在本发明的实施例中,提取出预处理后的会议记录文本中的实体及实体之间的关系包括:提取出会议记录文本中的动词及动词短语;将动词及动词短语作为实体关系组的谓词,并将动词及动词短语作为根节点遍历与之相关的名词短语;根据预设的语言规则确定动词和动词短语以及名词短语的关系。

在本发明的实施例中,上述方法还包括:在提取出预处理后的会议记录文本中的实体及实体之间的关系之后,将任意确定相同的实体与实体之间的关系的两组进行去重合并;对确定为语义近似的两组实体进行聚类;根据进行聚类后的实体及实体之间的关系构建对应的知识图谱。

在本发明的实施例中,上述方法还包括:在获取会议记录文本之后,获取会议记录文本对应的会议主题;根据会议主题获取相对应的专业词汇包;根据专业词汇包对会议记录文本中包含的专业词汇进行纠正。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科云谷科技有限公司;中联重科股份有限公司,未经中科云谷科技有限公司;中联重科股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011232612.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top