[发明专利]日历提醒生成方法和装置有效
| 申请号: | 201310430849.8 | 申请日: | 2013-09-22 |
| 公开(公告)号: | CN104463552B | 公开(公告)日: | 2018-10-02 |
| 发明(设计)人: | 康为 | 申请(专利权)人: | 中国电信股份有限公司 |
| 主分类号: | G06F17/00 | 分类号: | G06F17/00;G06Q10/10 |
| 代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 曲瑞 |
| 地址: | 100033 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 日历 提醒 生成 方法 装置 | ||
本发明公开了一种日历提醒生成方法和装置,涉及移动互联网技术领域。该方法通过自然语言处理技术和分类器,自动判断邮件是否为日程类邮件,进而从非结构化邮件文本中自动提取日程详情,并最终自动设置日历提醒。本发明降低了用户使用邮件系统的复杂性,提升用户使用体验,同时电子日历产品可以利用本专利技术实现从邮件中自动提取日程信息,丰富日程内容来源,提升产品的用户使用率和活跃度。
技术领域
本发明涉及移动互联网技术领域,特别涉及一种日历提醒生成方法和装置。
背景技术
电子邮件正越来越多的被人们使用,随着互联网的快速发展,电子邮件的内容也越来越丰富,海量信息需要用户通过邮件处理,其中较多的一类邮件即为包含日程信息的邮件,如:会议通知、账单截止日通知、酒店、机票订单确认等等。
当前,用户通常的做法是:收取邮件,人工在海量邮件中找到每个日程类邮件,手动将日程的主题、时间、地点、参与者等信息添加到日程管理软件中。
Gmail在邮件中提供了创建日程活动的快捷方式,但是Gmail 并且只提供了日程活动的模板,无法自动判断该邮件是否包含日程信息,而无法自动将日程内容添加。
发明内容
本发明的发明人发现上述现有技术中存在问题,并因此针对所述问题中的至少一个问题提出了一种新的技术方案。
本发明的一个目的是提供一种用于日历提醒自动生成的技术方案。
根据本发明的第一方面,提供了一种日历提醒生成方法,包括:
从邮件中提取出邮件内容,所述邮件内容包括邮件正文;
利用自然语言处理工具对所述邮件正文进行分词、词性标注和命名实体识别、去除停用词并统计非停用词的词频;
通过分类器将所述邮件划分为非日程邮件、创建类日程邮件、修改类日程邮件、取消类日程邮件;
对于日程类邮件,根据所述命名实体识别结果与规则模板匹配结合确定日程活动的时间、地点、主题、参与者信息;
根据所述日程主题、时间、地点、参与者信息生成日历提醒。
可选地,通过分类器将所述邮件划分为非日程邮件、创建类日程邮件、修改类日程邮件、取消类日程邮件包括:选取邮件正文长度、关键词的TFIDF(Term Frequency–InverseDocument Frequency,词频-反文档频率)、词频、词性、关键词左右各一个窗口的词及其词性作为日程邮件特征构建分类器的特征向量,通过支持向量机SVM分类器将所述邮件划分为非日程邮件、创建类日程邮件、修改类日程邮件、取消类日程邮件。
可选地,该方法还包括:预先利用人工标注的日程邮件语料训练所述SVM分类器。
可选地,邮件内容还包括邮件主题、邮件发送方、接收方和时间。
可选地,从邮件中提取出邮件内容包括:利用所述邮件中的TAG 标签去除掉所述邮件冗余信息,提取出所述邮件的主题、发送方、接收方、时间、邮件正文信息。
根据本发明的另一方面,提供一种日历提醒生成装置,包括:
邮件内容提取模块,用于从邮件中提取出邮件内容,所述邮件内容包括邮件正文;
语言分析处理模块,用于利用自然语言处理工具对所述邮件正文进行分词、词性标注和命名实体识别;去除停用词并统计非停用词的词频;
邮件分类模块,用于通过分类器将所述邮件划分为非日程邮件、创建类日程邮件、修改类日程邮件、取消类日程邮件;
日程信息提取模块,用于对于日程类邮件,根据所述命名实体识别结果与规则模板匹配结合确定日程活动的时间、地点、主题、参与者信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310430849.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可拆卸的电磁屏蔽方舱机柜维修门
- 下一篇:一种手动力矩输入装置





