[发明专利]通过计算机实现的信息处理方法及装置有效
| 申请号: | 201510347745.X | 申请日: | 2015-06-19 |
| 公开(公告)号: | CN104951543B | 公开(公告)日: | 2019-02-22 |
| 发明(设计)人: | 邵睿;沈剑平;李炫;莫洋;宋元峰 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F16/31 |
| 代理公司: | 北京天健君律专利代理事务所(普通合伙) 11461 | 代理人: | 罗延红;杨移 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 通过 计算机 实现 信息处理 方法 装置 | ||
1.一种通过计算机实现的信息处理方法,其特征在于,所述方法包括:
获取文章的文本信息;
从所述文本信息提取至少一个原始地理名词;
从预先建立的分级地理信息知识库分别提取与所述原始地理名词相应的分级地理位置信息,所述分级地理位置信息包括与所述原始地理名词相匹配的同级地理名词以及其所属的各行政划分级别的上级地理名词;
根据提取的所述原始地理名词以及所述分级地理位置信息分别从提取的所述分级地理位置信息获取至少两个地理名词评定指标的值,所述地理名词评定指标包括:提取的所述同级地理名词的行政划分级别以及多个所述同级地理名词所属的各行政划分级别的上级地理名词的重合度;
根据所述至少两个地理名词评定指标的值分别为提取的所述同级地理名词赋予权值;
根据为提取的所述同级地理名词赋予的权值分别对所述同级地理名词对应的分级地理位置信息进行可信度评分;
将所述可信度评分超过预定的可信度阈值的分级地理位置信息标注为与所述文章相关的地理信息。
2.根据权利要求1所述的方法,其特征在于,所述从预先建立的分级地理信息知识库分别提取与所述原始地理名词相应的分级地理位置信息的处理包括:
根据预先建立的地理信息简称全称映射表从所述预先建立的分级地理信息知识库分别提取与所述原始地理名词相应的分级地理位置信息。
3.根据权利要求2所述的方法,其特征在于,所述地理名词评定指标还包括提取的所述同级地理名词对应的原始地理名词的简称全称完整度。
4.根据权利要求1所述的方法,其特征在于,所述地理名词评定指标还包括提取的所述同级地理名词对应的原始地理名词的提取位置。
5.根据权利要求4所述的方法,其特征在于,所述文本信息包括所述文章的标题和正文;
所述原始地理名词的提取位置包括至少一个以下位置:所述标题、所述正文的开头、所述正文的结尾和所述正文除开头和结尾外的其余部分。
6.根据权利要求1所述的方法,其特征在于,所述地理名词评定指标还包括提取的同级地理名词对应的原始地理名词的出现次数。
7.一种用于信息处理的装置,其特征在于,所述装置包括:
文本信息获取单元,用于获取文章的文本信息;
原始地理名词提取单元,用于从所述文本信息提取至少一个原始地理名词;
分级地理位置信息提取单元,用于从预先建立的分级地理信息知识库分别提取与所述原始地理名词相应的分级地理位置信息,所述分级地理位置信息包括与所述原始地理名词相匹配的同级地理名词以及其所属的各行政划分级别的上级地理名词;
可信度评分单元,用于根据提取的所述原始地理名词以及所述分级地理位置信息分别对提取的所述分级地理位置信息进行可信度评分,
所述可信度评分单元包括:
地理名词评定指标值获取单元,用于根据提取的所述原始地理名词以及所述分级地理位置信息分别从提取的所述分级地理位置信息获取至少两个地理名词评定指标的值,所述地理名词评定指标包括:提取的所述同级地理名词的行政划分级别以及多个所述同级地理名词所属的各行政划分级别的上级地理名词的重合度;
可信度评分子单元,用于根据获取的所述至少两个地理名词评定指标的值分别对提取的所述分级地理位置信息进行可信度评分;
所述可信度评分子单元包括:
权值赋值模块,用于根据所述至少两个地理名词评定指标的值分别为提取的所述同级地理名词赋予权值;
可信度评分模块,用于根据为提取的所述同级地理名词赋予的权值分别对所述同级地理名词对应的分级地理位置信息进行可信度评分;
地理信息标注单元,用于将所述可信度评分超过预定的可信度阈值的分级地理位置信息标注为与所述文章相关的地理信息。
8.根据权利要求7所述的装置,其特征在于,所述分级地理位置信息提取单元包括:
分级地理位置信息提取子单元,用于根据预先建立的地理信息简称全称映射表从所述预先建立的分级地理信息知识库分别提取与所述原始地理名词相应的分级地理位置信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510347745.X/1.html,转载请声明来源钻瓜专利网。





