[发明专利]应用于手机短信查询的自然语言处理技术及装置无效
申请号: | 200810112609.2 | 申请日: | 2008-05-26 |
公开(公告)号: | CN101287229A | 公开(公告)日: | 2008-10-15 |
发明(设计)人: | 赵楠;张皖;胡啸 | 申请(专利权)人: | 北京捷讯畅达科技发展有限公司 |
主分类号: | H04Q7/32 | 分类号: | H04Q7/32;G10L15/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100052北京市东城区海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 应用于 手机短信 查询 自然语言 处理 技术 装置 | ||
技术领域
本发明属于手机扩展功能技术领域,特别涉及一种应用于手机短信查询的自然语言处理技术及装置。
背景技术
目前在短信上的应用服务由于不具备自然语言处理技术,只能是简单的定制服务等,用户需要学会发送代码等特定信息才能进行简单的应用。而对于搜索和路径这种用户需求复杂的应用,这种方式远远不能满足要求,还会因为繁琐的操作步骤造成不好的用户体验。
手机用户的一个特点为手机输入法带来的输入的错误率较高的问题,目前手机上输入方法大部分为拼音输入,而且在词组数量、易用性方面远远不如电脑上的输入法,这就造成很多用户在输入的时候因为操作失误或者为了快捷,使用音似的错别字或词。如经常可以发现类似这样的短信“直到(知道)到东直门怎么走不?”。在本地搜索和路况导航的应用中,这种情况出现的更多,因为大部分的地名、路名都不在输入法的词库中,用户为了方便往往用常用的音似词组代替,在很多情况下,用户甚至也不知道某个地名、路名的正确写法,只是知道读音,而且路名、地名中有较多的生僻字,用户不知道如何输入,只能用音似字或形似字代替。如“海龙大厦”,用户可能会输入成“海隆大厦”。“婺源”用户可能会输入成“无缘”或者“蝥源”。在系统层面上,传统的短信查询系统采用基于关键字或者基于指令的搜索技术,给用户带来了很大的不便,而上述过程在应用层面上很好的解决了这个问题。
发明内容
本发明的目的在于,使手机用户能够通过自然语言文本的输入,获得需要代码查询才能得到的相同交通信息。
为了实现上述目的,本发明提供了一种应用于手机短信查询的自然语言处理技术,首先,手机用户输入自然语言文本查询语句,然后,本发明的技术包含:步骤一:将自然语言文本分割成常用词;
步骤二:将常用词标注词性特征,并根据句法特征对查询语句进行分类;步骤三:将属于交通信息的自然语言文本挑选出;步骤四:识别出可能的领域实体;步骤五:识别出正确的实体的词和可能是实体的词串。
一种自然语言处理技术,所述步骤一进一步包含:借助常用词词典将自然语言文本分割成常用词。
一种自然语言处理技术,所述步骤二进一步包含:借助词性特征词典,将常用词标注词性特征。
一种自然语言处理技术,所述步骤三进一步包含:借助领域特征词典及领域问法特征词典,将属于交通信息的自然语言文本挑选出。
一种自然语言处理技术,所述步骤四进一步包含:借助领域相关实体词典,识别出可能的领域实体。
一种自然语言处理技术,所述步骤五进一步包含:借助POI实体词典,识别出正确的实体的词和可能是实体的词串。
本发明还提供一种应用于手机短信查询的自然语言处理装置,包含:将自然语言文本分割成常用词的分词模块;将常用词标注词性特征的词性标注模块;结合语义特征及问法特征,将自然语言查询语句分发到相关领域的问句领域识别模块;识别出可能的领域实体的实体识别模块;识别出正确的实体的词和可能是实体的词串的实体匹配模块。
本发明提供的技术方案的有益效果是:本发明将自然语言处理技术应用在短信查询平台上,用户不用记住复杂的输入格式,和平时输入短信方法类似,使用更加的人性化。通过本发明,用户自然语言输入的查询语句,变成了系统能理解的,由系统所掌握的地理实体词构成的一个联合查询,便于后面的地理导航系统的进一步处理。
附图说明
图1为本发明的自然语言处理技术流程图;
图2为本发明的拼音纠错技术流程图;
图3为本发明的自然语言处理装置结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷讯畅达科技发展有限公司,未经北京捷讯畅达科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810112609.2/2.html,转载请声明来源钻瓜专利网。