[发明专利]时间信息提取方法、装置以及计算机存储介质在审
| 申请号: | 201811643638.1 | 申请日: | 2018-12-29 |
| 公开(公告)号: | CN109766549A | 公开(公告)日: | 2019-05-17 |
| 发明(设计)人: | 王浩;周星;周永吉;陈凤杰 | 申请(专利权)人: | 贵州小爱机器人科技有限公司 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李笑笑;吴敏 |
| 地址: | 550017 贵州省贵阳市白*** | 国省代码: | 贵州;52 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本数据 计算机存储介质 时间信息提取 时间信息 词语 匹配 | ||
一种时间信息提取方法、装置以及计算机存储介质,所述方法包括:获取文本数据;对所述文本数据进行拆分,提取所述文本数据中的实体词语以及有效时间;将所述实体词语与有效时间进行匹配,提取所述文本数据中的时间信息。采用上述方法,可以提升提取的时间信息的准确性。
技术领域
本发明涉及数据处理领域,尤其涉及一种时间信息提取方法、装置以及计算机存储介质。
背景技术
如今,在企业交流以及人们日常交流中,文本数据中的信息量非常大。在各种场景中,文本数据中的时间信息是不可忽视的客观信息,因此,从大量的文本数据中提取准确的时间信息变得十分重要。
现有技术中,从文本数据中提取时间信息的方法通常是:从文本数据中提取数字信息,将数字信息作为时间信息。
然而,直接将数字信息作为时间信息,会导致提取的时间信息的准确度较低。
发明内容
本发明解决的技术问题是提取的时间信息的准确度较低。
为解决上述技术问题,本发明实施例提供一种时间信息提取方法,包括:获取文本数据;对所述文本数据进行拆分,提取所述文本数据中的实体词语以及有效时间;将所述实体词语与有效时间进行匹配,提取所述文本数据中的时间信息。
可选的,所述提取所述文本数据中的实体词语以及有效时间,包括:根据实体词库或词义分析算法提取所述文本数据中的实体词语,提取所述文本数据中的表征数字的信息作为有效时间。
可选的,在提取所述文本数据中的实体词语以及有效时间之后,还包括:获取所述实体词语中与时间相关的有效实体词语。
可选的,所述获取所述实体词语中与时间相关的有效实体词语,包括:根据实体词库或词义分析算法,在所述文本数据中,若在距离选定实体词语的预设字数范围内存在表征时间的实体词语,确定所述选定实体词语为所述有效实体词语。
可选的,所述将实体词语与有效时间进行匹配,提取所述文本数据中的时间信息,包括:根据实体词语的词义,将所述实体词语与所述实体词语对应的有效时间进行匹配,得到时间信息单位;根据多个所述时间信息单位中的所述实体词语在所述文本数据中的位置关联关系以及时间顺序关联关系,将所述时间信息单位组成时间信息。
可选的,所述根据多个所述时间信息单位中的所述实体词语在所述文本数据中的位置关联关系以及时间顺序关联关系,包括:通过正则表达式,确定多个所述时间信息单位中的所述实体词语在所述文本数据中的位置关联关系。
可选的,在所述提取所述文本数据中的时间信息之后,还包括:按照标准时间格式,将所述时间信息输出。
本发明还提供一种时间信息提取装置,包括:获取单元,拆分单元与提取单元,其中:所述获取单元,用于获取文本数据;所述拆分单元,用于对所述文本数据进行拆分,提取所述文本数据中的实体词语以及有效时间;所述提取单元,用于将所述实体词语与有效时间进行匹配,提取所述文本数据中的时间信息。
本发明还提供一种计算机可读存储介质,其上存储有计算机指令,所述计算机可读存储介质为非易失性存储介质或非瞬态存储介质,所述计算机指令运行时执行上述任一种的时间信息提取方法的步骤。
本发明还提供一种电子设备,包括存储器和处理器,所述存储器上存储有计算机指令,所述计算机指令运行时所述处理器执行上述任一种的时间信息提取方法的步骤。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州小爱机器人科技有限公司,未经贵州小爱机器人科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811643638.1/2.html,转载请声明来源钻瓜专利网。





