[发明专利]地图信息变化的识别方法和装置在审
申请号: | 201911281305.3 | 申请日: | 2019-12-13 |
公开(公告)号: | CN112988921A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 冯博琳 | 申请(专利权)人: | 北京四维图新科技股份有限公司 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F16/33;G06F16/35;G06F40/289;G06F40/30 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张晓霞;臧建明 |
地址: | 100094 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地图 信息 变化 识别 方法 装置 | ||
本发明提供一种地图信息变化的识别方法和装置。该方法包括:获取待处理文本的词项特征矩阵和文档表示特征矩阵;结合动态池化操作,获取所述待处理文本的神经网络特征矩阵;拼接所述词项特征矩阵、所述文档表示特征矩阵和所述神经网络特征矩阵,得到目标特征矩阵;根据所述目标特征矩阵,确定所述待处理文本是否为地图信息变化的文本。和现有技术相比,提高了识别结果的准确度。
技术领域
本发明涉及电子地图领域,尤其涉及一种地图信息变化的识别方法和装置。
背景技术
随着互联网技术的发展,电子地图现已成为家喻户晓的应用。现实场景下,道路和兴趣点POI等地图要素经常变化,如何从海量的文本信息中挖掘出体现这些变化的文本,进而根据这些文本更新电子地图是目前面临的主要课题。
现有技术中,主要通过特征工程或者神经网络的方法来实现目标文本的挖掘。然而,特征工程方面,在提取文档特征时需结合无监督算法,而无监督算法的误差势必会影响特征提取的准确度,最终造成挖掘效果不佳;神经网络方面,传统的卷积神经网络CNN模型中的最大、最小及均值池化方法在单个核中仅取唯一值容易导致特征的丢失,也导致特征提取准确度低,挖掘效果不佳。可见,现有技术的两种方法在目标文本挖掘方面准确度并不高。
发明内容
本发明提供一种地图信息变化的识别方法和装置,用以提高地图信息变化的识别准确度。
第一方面,本发明提供一种地图信息变化的识别方法,包括:
获取待处理文本的词项特征矩阵和文档表示特征矩阵;
结合动态池化操作,获取所述待处理文本的神经网络特征矩阵;
拼接所述词项特征矩阵、所述文档表示特征矩阵和所述神经网络特征矩阵,得到目标特征矩阵;
根据所述目标特征矩阵,确定所述待处理文本是否为地图信息变化的文本。
可选的,所述获取待处理文本的词项特征矩阵,包括:
对所述待处理文本进行分词处理、去停用词处理、低频词项过滤处理和词项标识转换处理,得到预处理文本;
从所述预处理文本中提取所述预处理文本包含的字符长度以及包含的词项数量;
从所述预处理文本中提取所述预处理文本包含的不重复字符长度以及包含的不重复词项数量;
根据所述预处理文本包含的各词项和关键词库中各关键词,计算关键词相似度;
将所述字符长度、所述词项数量、所述不重复字符长度、所述不重复词项数量和所述关键词相似度输入多层感知器MLP,得到所述词项特征矩阵。
可选的,所述获取待处理文本的文档表示特征矩阵,包括:
通过预先训练的文档主题生成模型LDA提取所述待处理文本的文档表示特征;
将所述文档表示特征输入多层感知器MLP,得到所述文档表示特征矩阵。
可选的,所述根据所述预处理文本包含的各词项和关键词库中各关键词,计算关键词相似度,包括:
根据所述预处理文本包含的各词项和预先训练的词向量转换word2vec模型,获取所述预处理文本包含的各词项的词向量;
根据所述关键词库中各关键词和所述词向量转换word2vec模型,获取所述关键词库中各关键词的词向量;
根据所述预处理文本包含的各词项的词向量和所述关键词库中各关键词的词向量,通过相似度公式计算所述关键词相似度。
可选的,所述结合动态池化操作,获取所述待处理文本的神经网络特征矩阵,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京四维图新科技股份有限公司,未经北京四维图新科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911281305.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:拓扑地图的处理方法、装置及设备
- 下一篇:广角透镜
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置