[发明专利]时间识别方法、装置、计算机可读存储介质及电子设备在审

专利信息
申请号: 201911380882.8 申请日: 2019-12-27
公开(公告)号: CN111222324A 公开(公告)日: 2020-06-02
发明(设计)人: 隆靖;胥世承;康波 申请(专利权)人: 南京医睿科技有限公司;南京懿医云大数据科技有限公司
主分类号: G06F40/279 分类号: G06F40/279;G06F40/289;G06F40/242;G06F16/903
代理公司: 北京嘉科知识产权代理事务所(特殊普通合伙) 11687 代理人: 刘力
地址: 210000 江苏省南京市*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 时间 识别 方法 装置 计算机 可读 存储 介质 电子设备
【说明书】:

发明公开了一种时间识别方法、装置、计算机可读存储介质及电子设备,方法包括:确定待识别文本中的至少一个第一时间信息;根据所述待识别文本,获取所述第一时间信息对应的验证信息;当所述验证信息满足第一预设条件时,将所述验证信息对应的第一时间信息确定为所述待识别文本中的可信时间信息。通过本发明的技术方案,可更为准确的识别待识别文本中的时间信息。

技术领域

本发明涉及数据处理技术领域,尤其涉及时间识别方法、装置、计算机可读存储介质及电子设备。

背景技术

自然语言处理是计算机科学领域与人工智能领域中的一个重要方向,其研究能够实现人与计算机之间的用自然语言进行有效通信的各种理论和方法,而时间对于理解事件具有重要的作用和意义。临床科研及药物临床实验均强依赖于患者的全生命周期临床数据,尤其是患者既往、目前进行的诊疗过程以及最终结局事件,如肿瘤患者既往每次的化疗时间、放疗时间、靶向治疗时间、病理确诊时间以及最终死亡时间等,这些关键的诊疗过程数据主要书写在现病史、既往史、病程记录及出院记录等自然语言文本之中,准确识别出自然语言文本之中的目的时间,对辅助研究患者生命周期内各重点诊疗事件的发生、发展、结局很有意义。

目前,主要通过正则规则与自然语言文本进行匹配,以从自然语言文本中提取出时间信息。对于自然语言文本中的绝对时间,如2013-5-6或2015年5月6日等,利用绝对时间正则进行匹配;对于自然语言文本中的相对时间,利用相对时间正则进行匹配。

但是,自然语言文本往往存在时间干扰信息,这些时间干扰信息容易与正则规则匹配,进而被识别为时间信息,从而降低了正则规则匹配出的时间信息的准确性。

发明内容

本发明提供了一种时间识别方法、装置、计算机可读存储介质及电子设备,可更为准确的识别待识别文本中的时间信息。

第一方面,本发明提供了一种时间识别方法,包括:

确定待识别文本中的至少一个第一时间信息;

根据所述待识别文本,获取所述第一时间信息对应的验证信息;

当所述验证信息满足第一预设条件时,将所述验证信息对应的第一时间信息确定为所述待识别文本中的可信时间信息。

可选地,所述确定待识别文本中的至少一个第一时间信息,包括:

对待识别文本与预设规则中的第一字符串进行匹配,当确定所述待识别文本中的至少一个第二字符串满足第二预设条件时,所述第二字符串确定为第一时间信息。

可选地,所述第二预设条件包括:所述第二字符串和所述第一字符串匹配,且所述第一字符串对应的节点标签为疑似节点。

可选地,所述根据所述待识别文本,获取所述第一时间信息对应的验证信息,包括:

获取所述第一时间信息在所述待识别文本中的前缀词和/或后缀词,所述前缀词和后缀词分别与所述第一时间信息相邻;

将所述前缀词和/或后缀词作为所述第一时间信息对应的验证信息

可选地,所述第一预设条件包括:

所述前缀词和/或后缀词属于预设时间触发词典中的词。

可选地,所述时间触发词典包括相对时间触发词和/或绝对时间触发词。

可选地,还包括:判断所述验证信息是否满足第三预设条件,如果是,则将所述验证信息对应的第一时间信息确定为所述待识别文本中的不可信时间信息,如果否,则执行所述当所述验证信息满足第一预设条件时,将所述验证信息对应的第一时间信息确定为所述待识别文本中的可信时间信息步骤;

所述第三预设条件包括:所述前缀词和/或后缀词属于预设时间排除词典。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京医睿科技有限公司;南京懿医云大数据科技有限公司,未经南京医睿科技有限公司;南京懿医云大数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911380882.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top