[发明专利]一种时间解析方法、装置、设备和计算机存储介质在审
申请号: | 201710655298.3 | 申请日: | 2017-08-03 |
公开(公告)号: | CN109388794A | 公开(公告)日: | 2019-02-26 |
发明(设计)人: | 徐巍越;牛也 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 孟繁琦 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 时间表达 时间因子 时间解析 计算机存储介质 优先级顺序 时间点 准确率 预设 语法 匹配 | ||
本发明提供了一种时间解析方法、装置、设备和计算机存储介质,其中方法包括:按照时间因子的优先级顺序,将时间表达与各时间因子的语法进行匹配,确定所述时间表达中各时间词的时间因子属性;依据预设的各时间因子属性对应的时间范围,确定所述时间表达中各时间词对应的时间范围;利用所述时间表达中各时间词对应的时间范围,确定所述时间表达对应的时间范围或时间点。通过本发明提供的方式能够提高时间解析的准确率。
【技术领域】
本发明涉及自然语言处理技术领域,特别涉及一种时间解析方法、装置、设备和计算机存储介质。
【背景技术】
随着智能化产品的不断推出,诸如智能问答、智能提醒等场景都会用到自然语言处理技术进行语义识别。其中时间解析是非常重要的一个部分,用户在采用语言进行需求表达时,常常会涉及到时间的内容。例如“后天是星期几”、“距离新年还有多少天”、“明天天气怎么样”、“下周一提醒我8点开会”、“情人节前一周提醒我买玫瑰”等等。
目前已经较成熟的技术将时间表达从句子中抽取出来,需要进一步做的是将抽取出的时间表达进行解析,解析成结构化的时间信息。现有技术中存在的时间解析方式主要包括两种:
一种是正则匹配的方式。例如通过正则表达式配合万年历的方式进行解析。但由于语言表达的多样化,例如当前时间是“2017年2月12日”,那么在表达“2017年2月14日”的时候,就可以采用诸如“后天”、“2天后”、“14号”、“情人节”、“48小时后”、“过了明天”等多种表达方式,那么对于正则方式而言,就很难全面覆盖到所有的表达方式。
另一种是采用PCFG(Probabilistic Context Free Grammar,概率上下无关文法)的方式,通过大量的语料标注,来判定时间原子的位移单位及位移量。然而这种方式目前在中文领域的准确率较低,一般只有60%-70%的准确率。
【发明内容】
有鉴于此,本发明提供了一种时间解析方法、装置、设备和计算机存储介质,以便于提高时间解析的准确率。
具体技术方案如下:
本发明提供了一种时间解析方法,该方法包括:
将时间表达与各时间因子的语法进行匹配,确定所述时间表达中各时间词的时间因子属性;
依据预设的各时间因子属性对应的时间范围,确定所述时间表达中各时间词对应的时间范围;
利用所述时间表达中各时间词对应的时间范围,确定所述时间表达对应的时间范围或时间点。
根据本发明一具体实施方式,所述时间因子包括以下至少一种:
世纪、年代、年、季度、月、旬、周、候、日、时辰、小时、分、秒。
根据本发明一具体实施方式,按照时间因子的优先级顺序,执行所述将时间表达与各时间因子的语法进行匹配;
其中,时间因子对应的时间范围越大,优先级越高。
根据本发明一具体实施方式,所述将时间表达与各时间因子的语法进行匹配包括:
采用最大匹配原则,将时间表达与各时间因子的语法进行匹配。
根据本发明一具体实施方式,所述各时间因子的语法包括绝对时间语法、相对时间语法、重复时间语法、缩略表达语法、区间式表达语法、节日表达语法中的至少一种。
根据本发明一具体实施方式,所述将时间表达与各时间因子的语法进行匹配,确定所述时间表达中各时间词的时间因子属性包括:
将时间表达与各时间因子的语法进行匹配,形成时间语法树,所述时间语法树中各非叶节点为所述时间表达匹配到的各时间因子属性,叶节点为所述时间表达中的各时间词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710655298.3/2.html,转载请声明来源钻瓜专利网。