[发明专利]一种语句生成方法及装置在审
申请号: | 201310440040.3 | 申请日: | 2013-09-24 |
公开(公告)号: | CN104462145A | 公开(公告)日: | 2015-03-25 |
发明(设计)人: | 董振华;欧阳靖民;张弓 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州三环专利代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语句 生成 方法 装置 | ||
技术领域
本发明涉及语言技术领域,具体涉及一种语句生成方法及装置。
背景技术
智能终端上的自动日记可以节省人们记录事件的事件成本,且从多个维度和视角记录事件发生的上下文,可以客观地重现事件,同时,智能终端的普及为自动日记的生成提供了多种维度的可用信息源和数据基础。然而,现有技术中的一种自动日记的生成方法,其源数据主要是文本数据,如博客信息、社交网络信息、短信信息、联系人信息等,从以上文本信息中抽取特征,生成日记,但当源数据缺少文本描述时,将无法生成日记;现有技术中的另一种自动日记的生成方法是分析手机使用情况和传感器数据,结合手机操作事件(如开关机、收发邮件等)与用户活动的对应关系,识别用户活动或发生的事件,最后按时间顺序组织一天发生的事件,生成日记,该方法生成的日记,其内容非常简单,形式为“时间:事件”序列,信息量匮乏,且没有使用完整的语句描述用户活动或事件,可读性差。
综上所述,如何根据终端的各种数据信息自动生成语句,用语句完整地描述在终端上发生的活动或事件已成为业界迫切需要解决的问题。
发明内容
有鉴于此,本发明提供了一种语句生成方法及装置,以期根据终端的各种数据信息自动生成语句,用语句完整地描述在终端上发生的活动或事件。
第一方面,提供了一种语句生成方法,包括:
收集终端的至少一个数据信息,其中,所述数据信息包括所述终端的运行信息、所述终端的操作信息和所述终端从外部接口接收到的信息中的至少一种;
确定所述至少一个数据信息的每个数据信息在待组成语句中的句子成分;
根据确定的所述至少一个数据信息在待组成语句中的句子成分,将所述至少一个数据信息组成语句。
在第一种可能的实现方式中,所述收集终端的至少一个数据信息,包括:
采集终端的至少一个数据信息;
检测所述至少一个数据信息的来源;
根据所述至少一个数据信息的来源,按照与所述来源对应的格式,将所述至少一个数据信息进行格式化,获得至少一个格式化后的数据信息;
所述确定所述至少一个数据信息的每个数据信息在待组成语句中的句子成分,包括:
针对每个所述格式化后的数据信息,从数据库中查找与所述格式化后的数据信息匹配的至少一个描述词语;
根据与所述格式化后的数据信息匹配的至少一个描述词语,确定每个所述格式化后的数据信息在待组成语句中的句子成分。
结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述根据与所述格式化后的数据信息匹配的至少一个描述词语,确定每个所述格式化后的每个数据信息在待组成语句中的句子成分之后,以及所述根据确定的所述至少一个数据信息在待组成语句中的句子成分,将所述至少一个数据信息组成语句之前,所述方法还包括:
针对每个格式化后的数据信息,根据与所述格式化后的数据信息匹配的所述至少一个描述词语在所述数据库中使用的概率,从与所述格式化后的数据信息匹配的所述至少一个描述词语中选择一个描述词语。
结合第一方面的第二种可能的实现方式,在第三种可能的实现方式中,所述根据确定的所述至少一个数据信息在待组成语句中的句子成分,将所述至少一个数据信息组成语句,包括:
根据确定的所述至少一个数据信息在待组成语句中的句子成分的类型,从句法结构库中选择包含所述至少一个数据信息的句子成分的类型的语句结构;
按照所述至少一个数据信息的句子成分在所述语句结构中的位置,将选择的与所述至少一个格式化后的数据信息匹配的描述词语组成语句。
结合第一方面的第二种可能的实现方式,在第四种可能的实现方式中,所述根据确定的所述至少一个数据信息在待组成语句中的句子成分,将所述至少一个数据信息组成语句,包括:
根据确定的所述至少一个数据信息在待组成语句中的句子成分,将选择的与所述至少一个格式化后的数据信息匹配的描述词语与语句模型库中的语句进行匹配;
获取所述匹配后的语句。
第二方面,提供了一种语句生成装置,包括:
收集单元,用于收集终端的至少一个数据信息,其中,所述数据信息包括所述终端的运行信息、所述终端的操作信息和所述终端从外部接口接收到的信息中的至少一种;
确定单元,用于确定所述至少一个数据信息的每个数据信息在待组成语句中的句子成分;
组成单元,用于根据确定的所述至少一个数据信息在待组成语句中的句子成分,将所述至少一个数据信息组成语句。
在第一种可能的实现方式中,所述收集单元包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310440040.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据分析辅助系统
- 下一篇:一种搜索网页页面中内容的方法及装置